標簽:
云對每個人來說都是又大、又白、又輕柔的夢境。當有人說他們的大數據戰略是“把悉數投入云端”時,你無法斷定他們能否是一個有遠見的人,或僅僅是重復一個教授在一次職業會議上通知他們的事。
大數據和云典范之間實踐的重復十分廣泛,你能夠聲稱你正在一個內部布置的Hadoop、NoSQL、或公司數據倉庫環境下處置根據云的大數據。請記住云被廣泛理解為包含“私有”布置以彌補或替代公共云、SaaS、和多租戶保管環境。
可是若是你把云的實踐界說約束于公共訂貨效勞內,你就能找到疑問的中心:辨認哪些大數據運用相對于內部布置更適合公共云/SaaS 布置(比方那些觸及提早優化的硬件設備或虛擬效勞器集群的運用)。
換句話說:你什么時候能夠經過引入一個外部效勞供貨商為你辦理它們,然后進步大數據的可擴展性、靈活性、功能、本錢效益、可靠性、以及可辦理性?以下是一些清晰的大數據在公共云中的運用實例。
現已在云中保管的公司運用程序:若是和許多公司相同——尤其是中小型公司——你運用了一個外部效勞供貨商供給的根據云的運用程序,許多你的源買賣數據現已被置于公共云之上。若是你在這個云渠道上有更深化的歷史數據,那么它能夠現已堆集至大數據級。若是外部效勞供貨商或它的合作伙伴之一供給了一個增值的剖析效勞——如客戶丟失剖析、推廣優化、或客戶數據的異地備份和歸檔——那么運用這些效勞會比將這些數據置于內部來得有意義。
需求相當大的預處置才能的大容量外部數據源:例如,若是你計劃經過監測交際媒體數據的聚合輸入來剖析客戶的情感,內部的效勞器、存儲、或帶寬容量能夠無法極好地為你完結這項使命。這是一個顯著的關于運用程序的比方,在這里你會期望運用一個根據公共云的、大數據驅動的效勞所供給的交際媒體過濾效勞解決疑問。
超越你內部布置的大數據處置才能的戰略型運用程序:若是你現已有一個專門為某個運用程序內部布置的大數據渠道(比方高容量非布局化數據源ETL專用的Hadoop集群),那么運用一個公共云來處置當時渠道所不適用的、或是按需效勞會更強健或合算的新的運用程序(例如多渠道推廣、交際媒體剖析、地輿空間剖析、可查詢歸檔、彈性數據沙盒技能)能夠會更行得通。事實上,若是你需求趕快取得PB級規劃的、流媒體的、多布局的大數據處置才能,那么一個公共云商品能夠是僅有可行的挑選。
十分大但僅僅時間短存在的沙盒的彈性供給:若是你有一個短期周轉的短期數據科學項目,而這個項目需求比慣常大一個數量級的探究型數據集市(又叫沙盒),那么云能夠是你僅有可行或能夠付出的挑選。你能夠很快在項目時間運作根據云的存儲和處置才能,然后當項目完畢時又能夠很快的撤銷之前裝備的全部。我稱之為“泡沫集市”布置模型,它是為云量身定制的。
若是你現已有過這其間任一的閱歷,那么根據云的大數據的戰略疑問就不是你該從何開端。跟著根據云的大數據效勞逐步老練以及性價比(包含功能、可擴展性、靈活性和可辦理性)不斷進步,這個疑問將會是你該在哪完畢。到本個十年的晚期,跟著越來越多的運用程序和數據遷移到公共云上,樹立和運作你個人的大數據布置的主意好像好像如今你想描繪個人的效勞器通常不切實踐。
|