
在不久前舉行的中國互聯網大會上發布的《中國互聯網發展報告(2021)》顯示,2020年,我國云計算整體市場規模達到1781.8億元,增速為33.6%。在此背景下,如何利用新技術高效存儲、處理數據,在降低成本的同時提高資源配置效率,成為了當下企業數字化轉型的重要議題。
為此,阿里云針對性開發的E-MapReduce云原生開源大數據平臺,以其易用性高,性能強,彈性大的特點,成為了廣大用戶的首選。其可以在為客戶提供簡單易集成的Hadoop、Hive、Spark、Flink、Presto、Clickhouse、Delta、Hudi等開源大數據計算和存儲引擎的同時,部署在阿里云公有云的ECS和ACK、專有云平臺。相對的,英特爾® 傲騰™ 持久內存打造的兼具出色的內存與存儲性能的解決方案,可以將高性價比的大容量內存與對數據持久性的支持巧妙地結合在一起。

為了讓更多的開發者們,體驗云上開發的優勢,阿里云計算平臺EMR團隊和英特爾公司聯合開啟了本屆“E-MapReduce極客挑戰賽”,廣邀創新極客,結合阿里云 EMR和英特爾® 傲騰™ 數據中心級持久內存,優化軟件系統和利用硬件的特征,追求TPC-DS測試集的最優性能。
目前大賽已公布的初賽題目,是由阿里云EMR 團隊提供用于比賽的Spark 3.1.2代碼分支,交給選手進行 Spark 代碼優化和參數調優以提升SparkSQL執行效率,同時組委會提供性能測評工具供選手自行測試(單機環境或EMR集群環境)。在比賽階段,選手將最終優化后的Spark代碼和調優參數打包,通過天池平臺提交,天池平臺會使用相同的性能測評工具,進行評測和排名。在初賽的基礎上,復賽需要處理的數據量更大,同時升級了 EMR 集群配置,并為每個 Worker 節點配置了 PMEM 持久內存,選手可以通過 App Direct 模式使用持久內存。

據悉,大賽現已開放報名,并將分為初賽、復賽及決賽三個賽段,評委嘉賓包括阿里云開源大數據平臺數據湖構建與分析負責人吳謂、數據湖存儲負責人鄭鍇,英特爾傲騰產品事業部中國技術創新中心資深軟件開發經理吳國安、英特爾加速計算系統和圖形事業部工程經理徐鋮等。

阿里云計算平臺事業部負責人賈揚清表示:”希望通過這次大賽,讓開發者們在體驗云原生的開發環境的同時,可以嘗試一次技術的挑戰。不僅在比賽中收獲好的成績,更重要的是尋找到代碼的樂趣和技術的收獲。”Intel 數據分析軟件部門總監Heidi Pan也表示: “希望大家通過這次比賽能夠有所收獲,能夠對數據分析引擎的性能優化有更深刻的體會與理解洞察”。
同時,阿里云研究員、開源大數據平臺負責人王峰也強調:“我們歡迎來自高校、企業及各行業的開發者們加入我們的比賽,希望各位開發者能在這次競賽中充分展示自己的技術能力。” 阿里云開源大數據平臺產品負責人陳守元表示:“我們希望為廣大的大數據愛好者及科研企業提供一個創新挑戰的平臺,一起來探索性能極限。”
據介紹,本次大賽最終將有1支冠軍隊伍、2支亞軍隊伍和3支季軍隊伍分獲10萬、5萬、2萬人民幣獎金及獲獎證書。值得一提的是,本次大賽還特別推出了“EMR開發者激勵計劃”,為邀請好友參賽的達人,以及參與比賽的選手分別制定了特別激勵規則與獎品,相信將為本次E-MapReduce 極客挑戰賽吸引更多行業內外的關注。

歡迎點擊賽事官網鏈接了解更多信息:
https://tianchi.aliyun.com/specials/promotion/emapreduceaep2021?spm=5176.14154004.J_1916026360.6.31fe5699qWz5kl

