- 演讲主题:电信运营商大数据应用和大云项目介绍
- 介绍电信运营商大数据应用面临的挑战和机遇,分析业界最佳实践在电信大数据领域的适用性,同时介绍中国移动在大数据研发方面的进展和成果
- 演讲嘉宾:钱岭 中国移动通信研究院云计算系统部总经理助理
- 中国移动通信研究院"大云"项目负责人,软件工程领域知名专家,高级工程师。2001年1月毕业于清华大学计算机科学与技术系,获得工学博士学位,主修软件工程方向。毕业后加入贝尔实验室基础科学研究院,2007年加入中国移动通信研究院,移动广告平台、受众监测等项目研究。后加入中国移动"大云"项目组,负责海量数据存储管理产品的研发和应用,担任"大云"项目技术架构师、项目组长、部门总经理助理。
- 演讲主题:重塑数据交互方式 软硬协同性能极速
- 从过去传统用数据仓库支撑报表系统对历史数据进行分析,到如今在移动终端上弹指间获取业务洞察,各种创新都在加剧这场技术变革;从硬件层面的多核、SSD、infiniband及可穿戴设备,到软件领域的内存计算、并行、可视化及虚拟化,无一不在帮助我们重新勾勒与数据之间全新的对话方式。把数据留给技术,把价值还给业务。本次演讲环节将带您了解华为与SAP在数据处理的基础架构层面的合作,将内存计算的优势优势延伸到了基础设施持久化层和IO系统,通过软件和硬件结合,从技术手段上获得极速性能,在业务上重新挑战我们的思维界限。
- 演讲嘉宾:王丰 华为FusionCube产品总经理
- 现任华为技术有限公司IT产品线云计算领域FusionCube产品总经理,他对华为公司FusionCube产品的研发、市场、供应、交付、服务、财务等端到端领域负责。
王丰先生2000年加入华为技术有限公司,在通信领域的电信业务处理方面有超过8年的工作经验,涉及程控交换机、软交换、IMS等多个产品的研发,曾作为华为公司代表出席ITU-T、3GPP、TISPAN等国际电信标准组织会议。出任现职之前,王丰先生曾任华为CDN控制产品总监,媒体云产品总监。
- 演讲主题:重塑数据交互方式 软硬协同性能极速
- 从过去传统用数据仓库支撑报表系统对历史数据进行分析,到如今在移动终端上弹指间获取业务洞察,各种创新都在加剧这场技术变革;从硬件层面的多核、SSD、infiniband及可穿戴设备,到软件领域的内存计算、并行、可视化及虚拟化,无一不在帮助我们重新勾勒与数据之间全新的对话方式。把数据留给技术,把价值还给业务。本次演讲环节将带您了解华为与SAP在数据处理的基础架构层面的合作,将内存计算的优势优势延伸到了基础设施持久化层和IO系统,通过软件和硬件结合,从技术手段上获得极速性能,在业务上重新挑战我们的思维界限。
- 演讲嘉宾:宋一平 SAP中国数据库和技术平台部售前总监
- 近30年的IT经验,从事数据库技术工作超过18年。亲自领导并参与了诸多全国重要项目的方案讨论、系统论证、技术答辩等工作。
- 演讲主题:珠联璧合:当大数据联姻数据仓库后
- 数据仓库增强旨在整合企业在数据仓库和大数据上的能力,以提升企业处理和应用大数据的实际能力。数据仓库增强始于企业现有的数据仓库架构,利用大数据技术来增强其功能,以解决企业在两方面的需求:1)利用类型多样的数据开发新的业务洞察的需求;2)扩展数据仓库架构迎合大数据功能需要的需求。
- 演讲嘉宾:邓淞 IBM软件集团全球信息管理InfoSphere资深产品经理
- Jon is a senior member of the IBM World Wide Product Management team. Jon has worked in various telecom companies before joining Ascential Software, then acquired by IBM. Jon has been focusing on helping organizations maximizing the impact of their data integration investment for the past 18 years. Jon has also worked as a software developer, tester and pre-sales professional in his previous roles. Now, as a Product Manager, Jon continues to work closely with customers and partners to understand their business issues and deliver value solutions with IBM InfoSphere product lines. He has experienced in MDM, Information Data Integration and governance portfolio. Jon graduated from University of Wisconsin with major in Electrical and Computer Engineering.
- 演讲主题:不只是事务处理 ——DM7的跨界应用与优化之道
- 数据库领域近年产生了前所未有的阵营分化,而DM7自出生起就定位为"既能事务、也能分析"。DM7如何做的?有哪些案例?有何优化与改进?本次报告向您介绍DM7是如何不断改进产品,应对跨界挑战的。
- 演讲嘉宾:周淳 达梦副总经理
- 华中科技大学硕士毕业,是达梦数据库核心研发人员,也是达梦公司新一代团队领导者的杰出代表。有多年数据库研发、测试和管理经验,掌握国际数据库前沿技术,是达梦数据库技术负责人。在担任技术副总期间,为提高技术管理与项目控制能力,大力对公司机构调整,组建了白箱测试部,综合测试部,β测试部,产品部,开发部,品质检验部,完成了达梦数据库技术服务体系雏形,为提高产品的性能和竞争力做出了巨大贡献。目前,达梦数据库产品各项功能、性能指标经权威机构评测已完全达到或超过国外同类产品的水平,某些方面还有创新和特色。新一代数据库产品DM已通过了我军唯一的最高安全级别—军B+级测试认证;通过10TB超大规模数据量测试和2000以上并发用户测试。
- 演讲主题:关系数据库的挑战与机遇
- 互联网及电子商务的发展对数据库提出了高并发、高可扩展、高可用以及海量数据存储的需求,各种NoSQL技术和产品如雨后春笋,不断涌现,看起来这些NoSQL新秀好像使得关系数据库黯然失色。是关系数据库的落伍了或者正在成为夕阳产业?还是人们不再需要关系数据库了?本次报告将与大家一起分析当前关系数据库面临挑战的背后的真实原因,共同探讨关系数据库面临的发展机遇。
- 演讲嘉宾:阳振坤 阿里巴巴高级研究员
- 北京大学本科、硕士和博士,1993/1997/1999年先后成为北京大学副教授/教授/长江学者,先后任职于北大方正、联想、微软、百度等。近年来主要研究领域为分布式系统和数据库,现为阿里集团高级研究员。
- 演讲主题:数据库的优化与调优:从理论到实践
- 什么是性能?性能的衡量指标是什么?有哪些较为成熟的性能相关的理论?针对一个系统,有哪些方法,可以用来提高这个系统的性能?让我们带着这些问题出发,一步步了解性能,进而更好的驾驭性能。
- 1. 性能的关键指标:Latency vs Throughput
2. 性能的一些方法:Query Theory, Amdhal's Law,。。。
3. 系统性能优化的一些常见方法:以MySQL为例
4. 系统性能调优的一些常见方法:以MySQL,Linux为例
- 演讲嘉宾:何登成 网易杭州研究院高级技术专家
- 技术爱好者,在数据库、并发编程、性能优化等领域,有一定的经验积累。平时通过个人微博:何_登成,或者个人网站http://hedengcheng.com,进行技术分享与交流。
- 演讲主题:大云Hadoop平台及应用
- 电信领域在海量数据批处理、大数据实时查询和分析以及数据挖掘等方面对Hadoop提出了更多的要求,本报告将主要介绍大云Hadoop平台的主要模块及其应用场景。
- 演讲嘉宾:王宝晗 中国移动研究院"大云"项目组Hadoop技术专家
- 熟悉HDFS、MapReduce、Yarn、Hive、Ambari等的代码,具有丰富的Hadoop运维和开发经验。
- 演讲主题:大数据下非结构化数据管理系统的设计及其应用案例
- Hadoop、NoSQL等开源软件已被广泛使用,但很难很好地支撑大数据管理和分析应用。TRS结合20多年非结构化信息智能处理研发经验,吸取Hadoop、MPP、NoSQL、Solr等开源软件的思想,融合检索引擎、多引擎机制、分布式并行计算和多副本机制、对等节点机制、新型列数据库存储机制、自然语言处理等先进技术。
- 演讲嘉宾:李银松 北京拓尔思信息技术工程师
- 毕业于北京信息科技大学,取得硕士学位。2008年加盟拓尔思,从事Hadoop、NoSQL技术研究,以及海量非结构化信息智能处理软件的研发。作为系统架构师角色,和研发团队一起设计了大数据下的TRS非结构化数据管理系统,该软件融合了搜索引擎技术和流行的大数据管理技术,该软件成功地应用于我国主流大数据系统,例如全球最大的新华社中文多媒体数据库、国知局最重要的专利信息检索和服务系统等。
- 演讲主题:Hadoop生态技术在阿里搜索的实战应用
- 介绍在阿里全网商品搜索业务场景下,阐述我们是如何利用并扩展Hadoop和HBase这两项核心技术,从而搭建起一整套海量商品存储系统和实时商品处理系统。
- 演讲嘉宾:王峰 花名:莫问,阿里巴巴高级技术专家
- 2006年北航计算机系毕业后加入阿里巴巴集团,一直从事搜索和分布式系统研发工作,目前在一淘及搜索事业部负责搜索离线系统团队。
- 演讲主题:Spark运行时模型剖析
- 在迭代型计算中,相较于传统Hadoop MapReduce程序,功能对等的Spark程序往往可以以几分之一的代码量达到一两个数量级的效率提升。这主要得益于RDD的表达能力和Scala在语言层面的灵活性。与此同时,Spark的运行时模型却比传统MapReduce更为复杂,若不能很好地加以理解,就难以开发出高效的应用。这次我们将一起解剖Spark的运行时模型,切实理清自己的每一行代码在何时、何地,以何种方式运行,背后又隐藏着怎样的代价。
- 演讲嘉宾:连城 Intel物联技术研究院研究员
- Spark contributor;目前专注于以Apache Spark为主的大数据处理平台,即将加入Databricks。
- 演讲主题:淘宝数据库高性能透明分库分表探索
- 介绍rds透明分库分表方案的一些实践,包括目前的单实例方案和进行中的跨实例方案,以及背后的运维工作。
- 演讲嘉宾:皓庭 淘宝数据库工程师
- 2011年7月毕业以来一直在淘宝核心系统数据库组(现阿里云数据库组)从事数据库平台相关的开发,包括数据库云平台rds以及可水平扩展的mysql云平台rds_partition,也涉及一些mysql存储引擎及其它分布式数据库相关的开发。
- 演讲主题:同步设计在高性能OLTP数据库中的实践
- 高性能OLTP数据库是数据库界的珠穆朗玛,与主流商业数据库相比,国产数据库、开源数据库差距明显。过去的一年里,我们成功地将同步技术应用于神通数据库的多个关键设计中,并在OLTP高性能领域取得了长足的进步。
- 演讲嘉宾:冯柯 神舟通用技术总监
- 计算机应用专业博士,神舟通用公司技术总监,国产神通数据库系列产品的技术创始人之一,具有十多年通用数据库内核一线研发及系统设计经验。数据库技术的分享者,关注高性能、高可用。
- 演讲主题:大型企业级应用环境SQL优化探秘
- 在开发人员和DBA之间(尤其和SQL优化专家之间)存在着永恒的矛盾,开发人员着眼于功能实现,而SQL专家着眼于性能,大型企业级应用环境中,这种矛盾同样存在,ERP系统及企业级软件优化一直是SQL专家的难题所在,在这个主题中,演讲者将和大家分享企业级软件中常见的SQL误区,以及精彩纷呈和匪夷所思的SQL优化案例。
- 演讲嘉宾:杨廷琨 云和恩墨售后交付总监
- Oracle ACE总监,ITPUB论坛版主,因其专研深入、涉猎广泛,有“百科全书”之誉。
- 演讲主题:爱奇艺在Hadoop生态中大数据平台架构与实践
- 介绍讲爱奇艺在Hadoop生态这边的一些平台架构(包括离线计算和实时计算),以及各种视频相关的业务如何基于大数据平台进行基础视频数据管理、推荐、搜索、广告分析、实时VV计算等。会谈到如何使用虚拟化技术支撑部分弹性的分布式计算。
- 演讲嘉宾:孙琦 爱奇艺分布式计算资深工程师。
- 2008年毕业于复旦大学计算机科学与工程系,并获取硕士学位,目前在爱奇艺从事Hadoop/HBase、实时计算与分布式中间件的研发工作。
- 演讲主题:基于验证的数据复 制技术-Percona XtraDB Cluster
- PXC(Percona XtraDB Cluster)集群是一种数据强一致性和集群高可用性的MySQL高可用架构。底层使 用基于数据验证的数据复制技术(galera)实现数据的同步和集群通信,上层是为封装了wsrep接口的MySQLserver。提供了多节点读写、并行复制、节点自动恢复、增量同步等多项特性,有效解决传统MySQL复制中数据不一致。
- 演讲嘉宾:刘小成 搜狐DBA
- 2010年毕业于西南科技大学信息对抗技术专业。关注开源社区,个人技术博客(xliu.blog.chinaunix.net),开源工具:xchliu@github。致力于数据库架构设计,数据 库调优和运维自动化。
- 演讲主题:加速数据洞察力-SQL Server 2014
- 演讲嘉宾:Jack Tang
- Jack Tang the Worldwide Business Lead for Data Insight & SQL Server at the Microsoft Corporation. Jack is responsible for strategic business planning and global field marketing for Microsoft's SQL Server business. Prior to his current role, he managed the SQL Server business for Microsoft Asia Pacific based in Singapore for two years as the Director of Product Marketing. Jack has been with the company for over 14 years, held various positions in different product groups. While in the Microsoft Office Division, he was responsible for partner marketing of SharePoint Server and other Office products. Prior to Microsoft, Jack had various product management roles at the Symantec Corporation, Citysearch.com, and Merisel. Jack holds a Bachelor of Science degree in Physics, a Master's degree in Electrical Engineering, and an MBA from the University of Southern California (USC).
- 演讲主题:自助式商业智能
- 演讲嘉宾:Chris Han(韩凯) 微软技术中心架构师
- 主要负责数据管理和商务智能领域。
在美国取得系统工程硕士学位后,服务于华尔街主要银行与金融机构。从事业务流程优化咨询与商务智能方案设计实施。
加入微软之前,任职于位于纽约的黑石集团。负责企业架构,数据治理与分析。自2013年加入微软技术中心以来,主要专注于为企业客户提供商务智能及大数据解决方案架构设计,帮助企业提升基于数据应用与分析的核心竞争力。
- 演讲主题:新一代大数据一体机-PDW
- 演讲嘉宾:Mark Jewett
- Mark Jewett is the Worldwide Director of Product Marketing for Server Appliances at Microsoft. He is responsible for business plan and go to market execution across server appliances in Microsoft's Cloud and Enterprise business, including Parallel Data Warehouse. Previously he spent four years in Singapore, managing the Office Division and SQL Server businesses in the APAC region. Before relocating to Singapore, Mark managed the worldwide partner ecosystem and competitive strategy for the SQL Server Business Group. Mark initially joined Microsoft to work in the Communications Sector team, focused on partners using the Windows platform for hosting services and the next generation of Cloud services. Mark has spent more than fifteen years in the information technology industry. Prior to joining Microsoft, he was a Product Line Manager at Siebel Systems, and a Director of Technology and Systems at several technology startups in the Seattle area.
- 演讲主题:内存数据存储在新浪的应用实践
- 互联网应用发展越来越快,留给后端响应时间越来越短,应用返回时间在百毫秒级别已经是上世纪得标准,内存数据库随之脱引而出。对于大多数应用来说,以Memcache/Redis为主的内存数据服务平台已经成为数据存取方面的核心力量,目前整个服务平台承载着整个新浪99%数据访问。作为国际上最的缓存平台和redis平台,在每天请求量15000亿+,60T+的内存应用的规模下,将面临什么的挑战?我们是应对这些挑战的?本次分享将介绍内存级存储应用在新浪方面得实践和应用。
- 演讲嘉宾:关启盼 新浪研发中心平台架构部 数据系统平台高级工程师
- 2011年加入新浪研发中心平台架构部,现从事新浪NoSQL/缓存/异步消息系统/中间件等数据组件得运帷和平台建设工作。
- 演讲主题:借助SAP HANA实现文本分析和文本挖掘
- 本讲座将向您介绍SAP HANA的文本分析功能以及如何结合R语言和SAP HANA自带的预测分析函数库来实现文本分析和文本挖掘。
- 演讲嘉宾:董玢 SAP中国研究院项目总监
- 十几年来一直致力于数据集成领域的工作,自2010年带领并参与了10多个基于SAP HANA的产品及客户项目. 2005年加入SAP,在此之前任职于德国海德堡大学,负责数据仓库开发工作。本科毕业于北京邮电大学,后获得德国Ulm大学计算机系硕士学位。
- 演讲主题:OceanBase:可扩展的分布式数据库
- OceanBase是阿里巴巴自主研发的分布式数据库,广泛应用在阿里集团在线数据库业务,整体服务器规模超过1000台。除了支持传统关系数据库的事务,OceanBase系统还允许线性扩展,即在线增加/删除服务器。本次报告将介绍OceanBase的最新特性以及研发过程遇到的一些问题。
- 演讲嘉宾:杨传辉 阿里巴巴架构师
- 花名日照,OceanBase架构师,一直从事大规模分布式存储系统、数据库开发工作,著有"大规模分布式存储系统:原理解析与架构实践"
- 演讲主题:Timesten内存数据库架构扩展应用实践
- 通过介绍传统的应用数据库系统架构现状以及传统基于磁盘的数据库面临的性能和吞吐量问题,说明架构扩展的重要性。分析Timesten内存数据库和传统关系型数据库系统有何不同,为什么可以降低延迟以及提供更大的应用吞吐量。进而介绍平安科技采用的两种定制化Timesten和Oracle协作运行的架构方案,并通过性能测试的数据来说明架构具有良好的扩展性。
- 演讲嘉宾:汪洋 平安科技数据库技术支持部部门经理
- 从1998年开始接触Oracle数据库,并在1999年考获OCP 7.3证书,从此与Oracle数据库结下不解之缘,至今已有16年。从2011年至今任职于平安科技(深圳)有限公司,当前负责数据库技术支持部的管理,负责生产、开发、测试数据库的运维工作,以及向开发部门提供应用系统的数据库架构设计方案,提供必要的数据库开发支持等。
- 在加入平安之前,供职于Oracle香港高级客户服务部门3年,为香港、澳门和深圳的客户提供Oracle数据库架构设计,升级方案制定,驻场支持等高级服务。
- 演讲主题:数据库SSD缓存的过去与现在
- 讲述当前数据库SSD缓存近些年的发展与应用,对SSD在数据库中的存储方案与缓存方案做一个深入的分析与比较。此外,介绍SSD缓存在网易数据库中的开发与应用。
- 演讲嘉宾:姜承尧 网易杭州研究院技术经理
- 负责MySQL数据库内核以及云数据库相关开发,主要研究方向为SSD与高性能数据库。热衷于研究MySQL数据库内核源码,并将一些创新的想法应用于MySQL数据库。
- 演讲主题:百分点内存数据库架构演变
- 当今互联网时代,对海量数据的实时计算成为可能。在百分点推荐引擎中,需要在几百毫秒内,从海量的数据中获取针对当前用户的个性化的推荐结果。传统的RDB+memcache的方式显然已经无法满足,只有全内存计算才能如此高效。推荐引擎系统等应用极大的依赖内存数据库,对于内存数据库的数据可靠性,高可用性,数据一致性都有较高的要求。在不同的应用场景下对内存数据库的要求也会有较大差异。经历几次架构变迁之后,平台级内存数据库趋于稳定。本次分享将介绍百分点在内存数据库方面的实践和应用。
- 演讲嘉宾:武毅 百分点高级架构师
- 毕业于武汉理工大学计算机专业,负责百分点大数据平台基础架构的设计与研发。长期活跃于Ubuntu等开源社区,专注系统级架构和软件开发。
- 演讲主题:Oracle 12c :新特性的设计与开发实现
- 在去"IOE"与数据整合的浪潮之下,Oracle于2013年推出了其新一代数据库产品Oracle Database 12c,在这个主题中,将和大家分享Oracle 12c的核心新特性及内部原理,并基于Oracle的软件研发分享新特性的需求分析、功能设计和技术实现过程。
- 演讲嘉宾:盖国强 Oracle ACE总监,云和恩墨创始人,ITpub版主
- 盖中国地区首位Oracle ACE,他曾经获评"2006年中国首届杰出数据库工程师"奖,拥有近10年的Oracle数据库实施和顾问咨询经验,对于数据库性能优化及内部技术具有深入理解。 盖国强先生是中国地区最著名的Oracle技术推广者之一,他的专著《深入解析Oracle》、《循序渐进Oracle》等书籍。2009年,盖国强先生创建了云和恩墨,致力于为中国数据库用户提供专业DBA服务。
- 演讲主题:PCIE SSD在数据库优化中的应用
- 基于PCIE SSD技术作为一个存储领域的新生技术,由于其卓越的随机IO性能在数据库(SQL/NoSQL/NewSQL)领域中应用越来越广泛,PCIe SSD由于摒弃了传统的繁杂多层存储协议,能为上层应用提供最为简洁的IO通道,从而能大幅度提升对时延敏感的数据库应用性 能。这次主要介绍1、什么是PCIE SSD?它的原理是什么? 2、PCIE SSD有哪几种技术方向,优劣?3、PCIE SSD如何为数据库加速?4、可以用在哪些应用场景?。
- 演讲嘉宾:闵春榕 Shannon Systems 解决方案架构师/产品经理
- 在数据库领域有10余年的技术积累,擅长数据库及系统架构设计及优化,历任Yahoo,澳大利亚optus, 惠普亚太区信息管理数据库技术专家。
- 演讲主题:使用MySQL构建百度商业数据库系统
- 百度商业数据库系统因为其所支撑的业务的重要性(如计费系统,广告系统),在数据安全性,服务稳定性,性能与扩展性等方面提出了苛刻的要求。业内的商业数据库系统多由Oracle/DB2等商业数据库软件加特殊的硬件设备(小型机/大型机)组成。随着业务和用户量上涨,这种架构存在价格昂贵,扩展性差得缺点。
次分享主要在以下几个方面介绍百度的创新:
- 1)如何保证MySQL集群数据安全性,特别是跨交换机/数据中心数据安全性;
- 2)如何保证MySQL集群服务的稳定性和高可用;
- 3)如何提升MySQL单机的性能;
- 4)如何选取和构建MySQL稳定版本,如何平滑进行版本升级;
- 5)MySQL数据库和业务应用之间高效关系的建立。
- 演讲嘉宾:尹博学 百度DBA架构师
- 负责数据库架构、MySQL内核相关的设计与开发工作。对MySQL主要功能模块及算法的原理与实现有深入的研究,擅长对MySQL内核及集群架构进行二次开发、数据库系统与SQL调优、大数据量的数据库系统架构设计,以提升数据库系统的稳定性、性能。
- 演讲主题:Exadata在1号店数据平台的应用实践
- 介绍Exadata的主流架构思想,其在1号店数据平台中的位置和价值,如何将其突出的优越性和我们的需求相结合,在满足电商数据处理能力上究竟给我们带来怎样的受益?
- 演讲嘉宾:李勇 1号店DBA
- 关注数据平台建设、数据库系统的发展。
- 演讲主题:帮助传统企业实现大数据应用的数据架构
- 1. 大数据应用已经从研究室走向实战应用,尤其互联网企业对大数据的应用逐渐趋向成熟,而传统企业还需要走一段更加漫长的道路。对于传统企业而言,开始使用HADOOP并非意味着真正实现了大数据应用。根据GARTNER 2013年对中国传统企业数据管理和应用情况的调查和预测,2~5年内企业更关注的是企业信息架构、元数据管理、主数据管理、数据质量等方面技术,而5~10年内传统企业大数据的实现和应用将成为传统企业最为关注核心的技术,而企业信息管理(EIM)相关技术是企业实现大数据应用的前提条件和主要组成部分,因此,它将成为企业近期所关注的主要焦点。
- 在本主题演讲中,将会针对企业信息管理(EIM)中所包含的EIM Govenance, EIM Core Process, EIM infrastructure等核心内容、实现技术、以及与数据架构、数据治理、数据质量等成熟技术的对应关系予以分析和分享,深入剖析数据架构、数据治理、数据质量等技术将如帮助传统企业为将来实现真正意义上的大数据应用目标做好准备和提供支持。
- 演讲嘉宾:郑保卫 EN-CORE高级技术顾问
- 韩国国立釜庆大学信息工学系获得工学博士,现任职于韩国最权威的数据及数据库公司EN-CORE高级技术顾问,并任EN-CORE中国分公司恩核(北京)信息技术有限公司技术总监,《海量数据库解决方案》的译者。在韩国曾经参与过大量关于数据库建模、数据库性能优化,元数据系统构建等大型项目,在重要学术刊物上发表过5篇论文。2013年12月被北京市朝阳区认定为高层次人才。
- 演讲主题:NewSQL-MPP数据库技术,支撑行业大数据应用
- 在大数据时代,数据呈爆炸式增长,单个SMP系统已经无法应付数据增长所带来的巨大压力。随着网络技术的发展,PC服务器的"小型化"以及Linux系统的成熟,基于NewSQL-MPP架构的新一代数据库技术成为各行业用户的首选。
南大通用作为国内数据库行业的领导者,是国内最早研发MPP技术和产品的数据库厂商,在电信、金融、政务、安全等行业拥有丰富的经验,成功帮助行业用户实现业务系统的搭建和系统支撑能力的提升。南大通用在MPP技术领域的核心产品主要是面向大数据分析处理的GBase 8a MPP Cluster。该数据库集群凭借大规模并行处理、列存储、自适应压缩和智能索引等核心技术,实现与国际主流产品技术同步
- 演讲嘉宾:武新 南大通用CTO
- 法国奥尔良大学和法国国家科研中心博士;南大通用GBASE系列数据库产品的总设计师;
在著名的甲骨文公司任职12年,是世界顶级的Oracle数据库专家。2010年获得中组部实施的国家"千人计划"荣誉(海外高层次人才引进计划),是国内基础软件行业唯一入选数据库技术专家。对目前最新兴的列存储技术、压缩技术、SQL优化技术、大型分布式系统等有长期研究和开发经验。曾参与法国家乐福超市、雷诺汽车公司、空客飞机公司、法国航空公司、法国通讯公司等数据库管理的技术支持、咨询和指导工作。
- 演讲主题:NoSQL技术在腾讯云上的应用
- 这是一个各个巨头都在开放的时代,这是一个极其容易爆发的时代,这是一个今天上线一款APP,明天访问就能突破每秒十万、百万甚至千万次的时代,如何紧紧抓住时代的机遇,实现持续稳定运营直至业务腾飞,是很多开发者都在头疼的问题。请关注腾讯NoSQL高速存储技术----腾讯海量平台的幕后英雄。
- 演讲嘉宾:张礼方 腾讯云存储研发负责人
- 演讲主题:Couchbase介绍及实践
- 目前业界使用得最多的Cache系统主要是memcached和redis,在使用memcached和redis过程中,还是碰到了比如
持久化、集群支持等方面的问题,通过这个演讲,分享一下我们团队如何Couchbase系统来解决这些问题,并且介绍一下
Couchbase的基本概念及原理。
- 演讲嘉宾:张虎 深圳微智云科技 CEO
- 专注于软件开发10年,对软件行业的各个领域都有兴趣。极光推送创始人,原CTO。
- 演讲主题:Erasure code在TFS中的应用实践
- TFS(Taobao File System)是淘宝的分布式文件系统,主要用于海量小文件存储,目前在淘宝部署总容量已超过20PB,为了降低存储成本,我们将erasure code(纠删码机制)应用到TFS系统中,预计能为TFS节省25%的存储成本。
- 演讲嘉宾:张友东 阿里核心系统存储组 资深开发工程师
- 从事淘宝分布式文件系统(TFS)的开发工作。
- 演讲主题:华为分布式存储技术与应用实践
- 本交流将向您介绍华为分布式存储系统的架构与技术,分享华为分布式存储系统在华为融合架构一体机解决方案FusionCube中的最佳应用实践。
- 演讲嘉宾:陈坚 华为高级产品规划经理
- 2000年加入华为,自2007年开始,一直从事分布式存储技术和系统相关的研究,产品架构设计与开发,技术和产品规划工作。是华为第一个分布式存储系统的架构师,曾在ICPP等学术会议上发表多篇分布式存储和P2P技术应用论文。
- 演讲主题:Cassandra在360在线存储方面的应用与改进
- assandra在360在线存储方面进行了大规模的应用,集群规模已经达到一定程度,支撑了云盘等在线业务的海量存储需求。
主要内容就是要介绍一下Cassandra在360存储方向的应用情况,以及在应用过程中遇到的问题及其持续改进。
- 演讲嘉宾:王锋 奇虎360高级系统工程师
- 现供职于360系统部,主要负责公司内部大数据在线存储平台的相关研发、支持等工作。
从2011年初开始研究Cassandra分布式存储系统,推动了Cassandra在360内部大规模的应用和改进,亲历了Cassandra集群规模从几台到万台规模的快速发展。
支撑了包括云盘、图片搜索、收藏夹等产品的后端数据存储。
- 演讲主题:京东分布式存储的持续研发
- 分享京东在分布式存储领域的投入,根据业务需求而分期开展、自主研发的一系列系统:海量小文件、类S3对象存储、类EBS弹性块存储、全托管NoSQL服务。
- 演讲嘉宾:刘海锋 京东系统技术部负责人、云平台首席架构师
- 京东架构委员会负责人。领导存储、缓存、消息、服务框架团队,致力于打造坚实的系统技术平台,稳定支持京东业务的高速发展。
- 演讲主题:PostgreSQL和MySQL的存储层深度解析
- 1.为什么数据库要独立管理数据数据库的存储层与文件系统的差异
- 2.PostgreSQL和MySQL的存储层对比:1)数据的外存形式2)数据的内部管理思路---表空间,大数据量的处理
3)数据的内部结构---索引存储的优点4)大对象的处理5)微对象的处理
- 3.PostgreSQL和MySQL存储层的优化
- 演讲嘉宾:李海翔 Oracle公司MySQL全球开发团队OptimizerTeam工程师
- 微博@那海蓝蓝,从事数据库研发、数据库测试与技术管理等工作10余年,对数据库的内核有一点研究,长于PostgreSQL和MySQL等开源数据库的内核与架构。现任职于Oracle公司MySQL全球开发团队,从事查询优化技术的研究和MySQL查询优化器的开发工作。曾参与了863、核高基、工信部、科技部、发改委、北京市科委等多个重大科技项目。2005年获得北京市科学技术进步奖一等奖,2006年获高级工程师(系统分析师)。
- 演讲主题:暂定
- 数据世界正在发生巨大的变化。今天,企业正想方设法从前所未有的数据量中获取业务洞察力,这些数据既来自于企业内部也来自外部资源,甚至是社交媒体网站。企业可以利用大数据解决方案从任何数据源中释放洞察力,并帮助业务获得受益。这些受益不仅限于收入增长,成本节约,也有全新的商业模式。凌云而智,你准备好了吗?
- 演讲嘉宾:谢恩伟 微软大中华区副总裁兼市场战略部总经理,微软大中华区首席云计算战略官
- 全面负责建立与执行大中华区的市场战略与公司的整体业务运营管理,同时他还肩负着微软大中华区云计算战略推进和实施的重任。
- 调整后的市场战略部将整合消费级和企业级市场营销战略,并同微软大中华区各部门紧密配合,进一步强化微软的云+端战略,帮助消费者及企业用户更好地认识和了解微软的产品及解决方案并带动销售。凭借17年的技术及管理经验,谢恩伟先生将带领整个市场战略团队为不断拓展大中华区的市场和业务而不懈努力
- 谢恩伟先生1994年在美国加入微软公司,2005年回国发展。在出任市场战略部总经理之前,谢恩伟先生曾担任微软大中华区开发工具及平台事业部(DPE)总经理以及微软中国研发集团服务器及开发工具事业部(STB China)总经理等职务,并帮助微软公司在上海组建了一支世界一流的软件开发团队。
- 演讲主题:大数据小算法 - 实用的用户行为研究方法
- 总体是一些简单的日志和抓取数据基础的统计算法,就能实现的用户行为研究。对网站、电商、游戏运营都有借鉴意义,开发者可以当理解数据分析系统需求的角度来看待。
- 案例是艾瑞在2013年的一个日志分析项目,属于电商网站内容和行为路径分析结合的分析方法,实现通过数据统计方法上的结论产出。结论指出两百多家淘宝店铺对一类产品的描述和定价,可以计算出这个产品所在品类的关键信息是什么。基于对内容因素的排除,结合价格作关键因素,也有办法计算出较为精确的临界值,辅助管理定价策略。
- 演讲嘉宾:郝欣诚 艾瑞咨询集团技术副总裁
- 2003年加入艾瑞咨询集团,出任公司技术总监。在多年的数据研究工作中,积累了丰富的网络营销数据分析经验。
在郝欣诚的带领下,艾瑞咨询集团成为互联网研究领域唯一一家以技术为核心竞争力的企业,保证了艾瑞数据的权威及公正性。为了更好的将这一优势扩大化,2009年2月,艾瑞咨询集团正式任命郝欣诚为技术副总裁,全面负责技术开发及团队建设,为艾瑞的技术发展提供有力支持。
- 演讲主题:互联网图片数据的挖掘与应用
- 互联网的内容主流和用户交流媒介,已经出现从文字转向图片的趋势,标志着互联网进入"读图时代"。本讲座将在"读图时代"的大背景下,介绍我们在图片数据的挖掘以及知识提取方面取得的一些技术进展,并探讨图片数据挖掘过程中遇到的技术挑战,以及图片知识信息在搜索引擎中的应用前景。
- 演讲嘉宾:牛正雨 百度资深研发工程师
- 百度主任工程师,曾负责query分析/网页解析等工作,现就职于互联网数据研发部门,专注于面向知识库的数据挖掘相关工作。
- 演讲主题:谈数据仓库下数据库设计模式变迁
- 1.OLAP产生的背景
2.范式设计
3.反范式
4.OODB 模式
5.EAV Entity Attribute Value
6.PIVOTING
7.XML
8.No-Schema
9.Relational Database 的发展
- 演讲嘉宾:高峡 重庆众意网科技有限公司cto
- 主持产品研发,市场开发,咨询管理,项目实施等全面经营管理工作,创新性的提出虚拟立方体技术,解决从二维数据库向多维数据集转换的通路,领导BI商务智能产品开发,领导实现电信行业网管商务智能项目。
- 演讲主题:大数据推动电子商务的商业价值发现
- 从应用的角度,拆解几个商业价值发现的大数据应用场景案例。每个场景案例从灵感触发,到算法探索,到工程化技术选型,再到上线效果评估的全过程。
- 演讲嘉宾:傅强 当当网技术副总裁
- 目前负责当当网网站系统、搜索推荐广告系统、数据业务系统和大数据技术的研发工作。自2006年4月加入当当网,在工程师岗位上先后研发了当当站内搜索引擎、个性化推荐引擎等高实时性高可靠性服务,自2009年起开始关注开源分布式存储与计算技术,2010年起在公司内推广大数据应用。走上管理岗位后,管理技能随队伍成长共同提升。在2012年全面铺开大数据应用、站内搜索技术架构全面升级、成立反作弊技术团队;2013年CRM产品线研发上线、推荐系统贡献较2012年大幅度提升、搜索点击率提升10%、出版物评论智能排序、搭建CMT系统、重构大数据分析引擎为BI系统提供更多大数据能力。
- 演讲主题:智联招聘数据库技术架构及变迁
- 1. 通过数据物理存储和技术架构两个方面来阐述智联招聘的数据库架构变迁历史。
- 2. 智联人才库的变迁:从百万、千万、到亿级数据库我们如何应对业务迅猛增长带来的数据存储与查询需求。
- 3. 单一DB、文件存储服务器到Sql Server集群的变革。
- 4. 数据架构不只是Sql Server,更应是对多种存储资源的综合利用:Memcached、Redis、Mongodb、Solr等。
- 5. 多元化存储介质带来的优势与问题,庖丁解牛由大化小。
- 6. 数据架构的变迁带来的业务逻辑变更问题处理实践。
- 7. 因时而治,不要太过妄想未来:稳步和可预见的对数据负载能力做出合理的评估和技术架构调整。
- 8. 未来分布式数据库架构展望。
- 演讲嘉宾:孙伟 智联招聘-架构师
- 主要负责智联招聘整体网站的技术架构、性能优化、SOA体系规划、ESB架构建设等方面的工作。曾就职于凡客诚品、银泰网等电子商务网站,拥有10年以上.Net平台应用研发及架构设计经验,对大型网站体系架构、高并发、分布式系统设计、NoSql系统应用等有丰富的实践经验。
- 演讲主题:追求数据真实的律动——淘宝数据可视化实践
- 从将数据可视化概念引入公司,帮助公司对外数据展示项目升级换代,到抽象需求建立通用的datav.js数据可视化前端js组件库,并一步步将数据可视化真正落地到产品,
在这一路上数据可视化在阿里巴巴内部从一个光鲜炫酷的新兴概念,扎根成为了帮助数据分析,简化数据理解的本质需求。所以这次演讲的主题会定在怎样让数据可视化落地,同时在真正落地
的时候又遇到了哪些困难以及我们的应对方法。
- 演讲嘉宾:宁朗(闻啸)阿里数据可视化开发工程师
- 阿里巴巴数据平台事业部——数据产品——资深开发工程师;datav.js数据可视化组件库开发成员;datavlab.org数据可视化社区成员
- 演讲主题:R与可视分析
- R 官方网站的第一句话是这样介绍R 语言的:"R 是一个用于统计计算和绘图的自由软件环境。"这句话正好突出了R的两大特色:数据分析和数据可视化。经过长年的开发和完善,目前R主要支持了四套图形系统:基础图形(base)、网格图形(grid)、lattice 图形和ggplot2。除了简要介绍R图形技术之外,本演讲还会注重展示一些整合了数据分析和可视化的综合案例。
- 演讲嘉宾:魏太云,统计之都理事会主席
- 领域是统计建模、机器学习、数据可视化,合作翻译出版了《ggplot2:数据分析与图形艺术》、《R数据可视化手册》等书籍。
- 演讲主题:ECharts:深度数据互动可视化
- 大数据的时代背景下,数据可视化被越来越多的提及,而这个火热的技术领域也正在发生着技术变迁。业界领先的数据可视化产品已经不再是单纯的视觉呈现,拥有互动图形用户界面(GUI)的可视化产出会是未来,可视化的数据呈现不仅是诉说,而是允许用户对所呈现数据进行挖掘、整合,让可视化成为辅助人们进行视觉化思考的方式。ECharts开源来自百度商业前端数据可视化团队,我们全力打造的深度数据互动可视化图表。
- 演讲嘉宾:林峰 百度资深前端研发工程师
- 百度商业前端数据可视化团队负责人,资深前端研发工程师,ZRender、ECharts作者,目前专注于数据可视化方面的研发工作。
- 演讲主题:数据分析漫谈-视频网站数据分析实践与个案分享
- 1.数据分析工作如何在企业中开展,如何把数据转化为有竞争优势的生产力
- 2.数据分析师的18般武艺
- 3.数据分析个案分享
- 演讲嘉宾:杜长嵘 优酷土豆集团数据分析高级总监
-
- 演讲主题:混合异构数据的清洗、存储、挖掘架构选型和设计策略
- 在大数据互联网背景下,数据源产生非常多,导致对数据的清洗、存储、挖掘都提出非常高的要求,主要介绍由于Admaster的数据源类型多样,包括有被动获取的请求,也有微博,SNS,新闻,博客,论坛,行业网站等主动抓取的请求,所以重点介绍离线数据分析如何建立在Hadoop之上,而流式计算和实时计算则为什么采用Storm、Spark、MongoDB、MySql等。
- 演讲嘉宾:卢亿雷,AdMaster高级技术总监
- 曾在联想研究院联想网盘、百度基础架构部、Carbonite China工作,06年研究生毕业后一直从事分布式存储架构,大数据挖掘分析相关工作。对分布式存储和分布式计算、超大集群等有较多实践经验,对Lustre,HDFS,HBase,MapReduce,MongoDB等有比较多的理解。有两个发明专利,《一种分布式文件系统及其数据访问方法》和《一种数据备份的版本管理方法及装置》。
- 演讲主题:数据治理与数据仓库设计
- 目前,"大数据"已经从之前的概念逐渐"落地",很多组织或企业通过完善、扩展其传统数据仓库平台,实现了大数据分析与服务,取得了不错的效果。但是要想真正实现对于数据的"说得清、管得住、用得好"的终极目标,必须及时全面地开展"数据治理"工作。
本主题将基于实际管理经验,从"组织机构"、"标准规范"、"流程机制"、"工具平台"四个要素介绍"元数据管理"、"主数据管理"、"数据质量管理"等数据治理工作,并和大家分享在做好数据治理前提下,实施大数据平台的实际项目经验。
- 演讲嘉宾:万振龙 某国企软件研发部总监
- 目前担任某国企软件研发部总监,负责部门整体管理,有10年的大型BI系统设计、开发经验;担任过国家2个金字工程中数据仓库部分的项目负责人; 技术方面精通SQL Server、Oracle等数据库和ODI、SSIS、GoldenGate等ETL软件产品;担任过项目实施的各种角色,包括项目管理、系统架构设计、需求分析、解决方案开发、方案交付、客户培训及系统售后管理等工作。
- 演讲主题:O2O数据仓库实践——应对快速变化的业务模型
- O2O这个增长迅猛,快速变化的行业,对如何建立数据仓库提出了很多挑战——快速变化, 快速处理, 快速应用是三个最核心的需求。 美团作为国内最大的本地服务电子商务公司,在支撑前线的数据仓库设计上面临哪些挑战?又有哪些方案?此次分享将会介绍,美团数据仓库的架构和核心工具,以及在数据建模和管理上的探索、实践和创新。
- 演讲嘉宾:徐章 美团数据仓库架构师
- 负责美团数据仓库的建设和数据仓库工具的开发。
- 演讲主题:数据库一体机在运营商数据仓库系统中的运用
- Exadata 已经在电信、移动等运营商中广泛使用,X4再次强势来袭,如何在数据仓库系统中更好的使用Exadata的混合列压缩、智能扫描、存储索引等特性,如何最优化Exadata的初始化、存储管理、与OEM12c无缝结合?"本应"快速生成的经营分析报表迟迟不出,紧要关头故障频现怎么应对,大量的实践经验与案例与你分享。一体机时代即将到来,你准备好了吗?
- 演讲嘉宾:王科:上海新炬网络技术有限公司 交付中心副总监
- 七年以上电信及税务行业IT服务经验,有丰富的大型Oracle数据库优化、故障处理及TimesTen内存数据库运维实战经验。新炬公司目前是国内最大的数据库第三方服务商,服务客户覆盖移动、电信、金融、航空、政府、制造等多个领域,拥有国内最大的ORACLE DBA和OCM大师团队。
- 演讲主题:应用导向下传统数据体系部分大数据化实践
- 对于很多大型企业而言,满足业务变革所需的应用开发依然是信息化的主要源头和核心,但受到数据类型和容量不断扩大的影响,传统的关系型为主的数据体系也需要适当补充大数据技术,在满足新应用功能的同时能够为现有应用功能增加更加面向现场、面向物联网的处理支持,及更加面向当前业务活动和服务对象需要的即席分析支持。
本文将结合项目设计实践分享相关经验。
- 演讲嘉宾:王翔 某部委信息中心开发部主任工程师
- 首都经贸大学国际贸易在读博士生。近20年数据库开发和使用经验,主要从事信息系统集成、信息安全技术设计工作和技术贸易理论研究工作。近年各类刊物发表技术文章约150余篇。著有《模式——面向工程化的实践及扩展》系列。
- 演讲主题: 客户互动优化--洞悉客户心声与大数据运营
- 大数据时代所面临的挑战与压力;价值提升第一步:以大数据的思维展现价值;大数据运营解决方案 Big Data Workshop;运营管理内部维度改善客户体验。
- 演讲嘉宾:王亚叶 Verint 运营管理优化解决方案高级顾问
- 2002年开始从事Call Center的运营管理工作,在客服中心行业具有10年以上工作经验,深刻理解呼叫中心规划、建设及运营。2005年开始从事运营管理咨询项目顾问服务工作,曾任知名咨询公司高级顾问服务经理,致力于国内客服中心运营管理的顾问及培训服务,2009年任知名软件技术解决方案公司方案解决顾问,为国内银行业、保险业、电信业、外包Contact Center客户解决劳动力管理、绩效管理、质量管理等系统管理问题。
作为资深顾问,曾主持多个大型客户联络中心的咨询服务。
- 演讲主题:百度OLAP报表分析系统
- 百度OLAP报表分析系统包括日志处理平台、OLAP存储引擎、业务数据库,它整合各个产品线的日志数据,使得统计数据可以统一生成和统一管理,达到共享。
- 以广告业务为例,百度OLAP报表分析系统通过与广告数据库无缝结合,使得百度广告主、策略分析人员、高层决策人员更便捷地分析对比广告表现,从各个维度诠释百度广告投放效果,为百度广告策略快速迭代、运营分析能力的提升奠定坚实基础。
- 演讲嘉宾:徐冬奇 百度基础架构部大数据团队架构师
- 对大数据平台(OLAP分析、用户属性挖掘)、分布式存储技术等有所擅长,关注广告平台。
- 演讲主题:腾讯全流程的实时计算体系及其应用
- 大数据处理平台为技术基石, 以精准推荐业务为价值体现。
- 演讲嘉宾:洪坤乾 腾讯公司资深架构师
- 现任职腾讯公司数据平台部,主要负责腾讯个性化精准推荐平台的系统架构设计; 10年以上软件设计开发经验,在分布式系统设计以及海量数据处理方面有比较丰富的经验积累。
- 演讲主题:天猫商品详情页满意度模型
- 通过用户在商品详情页上的大量行为分析,建立一套转化率预估的模型,预估每个商品的成交转化率。
- 演讲嘉宾:周祥军 天猫搜索技术专家
- 2009年~2013年分别在淘宝广告技术部和百度凤巢从事互联网计算广告算法技术研发,主要涉及数据挖掘、
自然语言处理,机器学习,广告竞价策略。今年5月份开始负责天猫搜索算法。
|