標簽:
IBM公司日前在拉斯維加斯”Insight 2015″大會上宣布通過Apache?Spark重新設計了公司超過15個核心分析與商務解決方案,極大加快了實時處理能力。IBM還宣布,繼測試版 計劃成功試用13周之后,在IBM Bluemix上正式推出其Spark即服務(Spark-as-a-Service)解決方案——IBM Analytics on Apache Spark,試用期間,超過4600名開發者利用它來構建智能商務及數據驅動型消費者應用。
由 加州大學伯克利分校AMPLab實驗室開發的Apache Spark以易于創建能夠利用來自復雜數據洞察的算法而聞名。通過利用適用于頻繁訪問的信息并能更快處理數據集的Spark內存緩存,IBM能夠簡化一些 最廣泛使用的軟件解決方案與云數據服務架構,例如IBM Big Insights、IBM Streams和IBM SPSS。
例 如,IBM把公司最流行的數據準備和數據精化服務Data Works代碼庫從4,000萬行代碼縮至500萬行代碼,削減超過87%,通過在Spark上重新開發而簡化操作,大大降低構建與部署時間。Data Works現將直接得益于Spark的可擴展性、分布式編程模型、數據源連接及項目參與者向Spark交付的頻繁增強功能。
Spark 是一個敏捷、迅速并易于使用的開源技術,同時能夠從根本上簡化開發應用的流程。作為一項基于IBM托管的云數據服務中為廣泛的開發者提供的服務來 說,IBM Analytics for Apache Spark可輕松集成IBM Bluemix云平臺上的開源、專屬和第三方工具。因此,開發者可以實時地將分析工具融入到他們開發的應用中。
位于 加拿大新斯科舍的SolutionInc公司提供全球50個國家的酒店、會議中心和熱點中托管、高需求的公共Wi-Fi和有線訪問。作為一家跨國Wi- Fi提供商,SolutionInc需要迅速分析來自多個數據源的海量Wi-Fi數據集,以識別流量模式與趨勢。利用IBM Analytics for Apache Spark on Bluemix,SolutionInc能夠提取諸如峰值時間、黃金地段、路由模式與設備類型等相關數據集,為其客戶提供可行洞察。 SolutionInc總裁兼首席執行官Glen Lavigne表示:“通過IBM Spark技術,我們能夠探索超過2.4億行Wi-Fi日志信息并識別設備流量模式與多方位數據。這些分析工具能夠讓我們更好地了解市場需求和趨勢,并為我們的客戶提供更卓越的服務。”
IBM大數據與分析產品開發部副總裁Rob Thomas表示:“對 于那些想要通過其數據做更多事的數據科學家和工程師們來說,諸如Spark等技術的開源創新實力與吸引力不容否認。IBM致力于利用Spark作為其行業 領先的分析平臺基礎。通過提供基于IBM Bluemix完全托管的Spark服務,數據專家們能夠更快訪問并分析其數據,且大大降低復雜性。”
IBM云數據服務總經理DerekSchoettle表示:“云 數據服務聚焦于給開發者提供必要的工具,使他們能夠盡快的將應用投放到市場上。IBM Analytics for Apache Spark簡化了開啟Spark的進程,讓數據專家可以專注于開發應用,而不是去耗費時間管理Spark集群或者具體的操作。由于融入了關鍵的IBM云數 據服務,因此用戶可以更輕松的在Bluemix上構建一套完整的解決方案,并以事半功倍的效果從更多的數據中提取更深刻的洞察!
自 2015年6月宣布將致力于Apache Spark社區以來,IBM已經對Spark項目做出了60多項貢獻,其中包括機器學習與SQL,同時IBM Spark技術中心已雇傭了35名Apache Spark提供者,并通過BigData University.com的免費線上課程培訓了310,000余名數據專家。由IBM在美國波士頓、舊金山、中國北京和上海等城市主辦的全球 HackSpark挑戰賽,數據專家們已創建出100逾種不同的數據產品,其中包括一個利用Spark分析與安珀警報相關的車輛流量的視頻傳送項目,及一 個將被舊金山警察局用來幫助預測犯罪事件的熱圖。
可參看來自IBM商業價值研究院的更多詳情:根據”Analytics: The Upside of the Upsurge”報告顯示,至少有四分之三的研究人員正計劃或者已經應用到數據流、實時數據、自主分析工具和基于云的數據或分析服務。
|