主讲人简介:
王永坤,博士,目前供职于上海交通大学网络信息中心。2004年毕业于上海交通大学,先后任职于IBM和美国国家仪器公司。2011年从东京大学取得博士学位,曾获得东京大学奖学金、文部省及JSPS Global COE奖学金。之后供职于日本最大互联网企业Rakuten集团大数据部和Rakuten技术研究所,任数据科学家(Data Scientist)和首席软件工程师(Chief Software Engineer),负责大数据平台的架构设计、管理及应用。在PB级数据量、来自各行业的异构数据、以及日均十亿级别数据流的实时大数据分析系统方面,有多年企业级研究分析经验。在美日等国申请多项专利,发表多篇国际会议论文,任多个国际会议的组委会委员,以及IEEE Transactions on Computers等杂志的审稿人。ACM及CCF会员。
报告简介:
由于校内外数据的计算和存储需求不断增大,上海交通大学开始着手构建自己的校级大数据分析平台,并作为转化医学国家重大基础设施的计算平台。在这次报告中,我会分享一下数据平台搭建的第一手经验。从机器配置,到软件架构设计及安装配置(Hadoop、Spark等),到运维,再到一些相关的数据应用,特别是支撑了上海市开放数据创新应用大赛(SODA)的一些经验。
语言:中文