议程详情
大会主场:智能创新 数赢未来
08:50-09:25
  • 智算多模:达梦构建新一代智能数据引擎

    达梦数据致力于提供全栈式数据产品和相关服务,20+年的数据行业经验让我们看到多模处理能力是数据库技术发展的一个重要方向。与此同时,AI时代的到来为数据库提出了新的需求。为了满足未来业务的需求,达梦数据正全力突破智算多模数据库核心技术,在计算引擎、存储引擎和AI能力上都取得了一定的成果,我们这次会介绍目前的技术进展和计划突破的一些核心技术,也期望能够与达梦的合作伙伴、高等院校一起联合攻关智算多模数据库核心技术,并能够将相关成果应用于达梦全栈产品。

    • 付新
      武汉达梦数据库股份有限公司
      副总经理、创新研究院负责人

      付新,武汉达梦数据库股份有限公司副总经理、创新研究院负责人、达梦数据技术(江苏)有限公司总经理,20余年国产数据库内核设计、开发和测试经验,主导研发了达梦公司多款非关系型数据库产品,目前主要负责智算多模数据库核心技术攻关。

09:25-10:00
  • 华为云数据库数智跃升,打造AI时代智能数据新底座

    数字化转型进入深水区,企业对数据库性能、安全性、可靠性和智能化提出更高要求。华为云将一如既往地深耕数据库架构根技术,基于华为“大杂烩”的结构优势,实现软硬、软软全面协同创新,构筑领先的差异化竞争优势,打造可持续演进的AI智能数据新底座。

    • 窦德明
      华为云
      数据库首席产品专家

      专注数据库技术研究、产品研发和生态建设近15年,当前负责数据库产品的持续规划与落地推进。

10:00-10:35
  • 腾讯云TDSQL构建高效、可靠的数据库新生态

    在国产化浪潮下,腾讯云在推动数据库技术实现安全可控的道路上取得了开拓式创新成就,国产数据库TDSQL已服务近半国内TOP20银行,TOP10银行中服务比例高达70%,客户数超过3000多家,为国产化数据库的发展和应用积累了宝贵经验。本次演讲将重点分享腾讯云在自研数据库领域取得的突破以及构建的数据库新生态。

    • 王义成
      腾讯云
      腾讯云数据库总经理

      王义成,腾讯云数据库总经理,深耕数据库领域10余年,数据库技术专家工程师。从事过数据库研发、数据库管理员以及云数据库产品经理多项工作。作为腾讯云数据库核心人员参与国产数据库TDSQL系列产品的自主研制与设计,带领团队持续用核心技术帮助企业完成数字化转型和业务创新。

10:35-11:10
  • 面向多模态数据处理需求的AI基础设施革新与实践

    在Data+AI时代,多模态数据的实时处理能力是构建自主智能(Agentic AI)的核心驱动力。新一代的智能化云原生数据库,以其三层资源解耦的极致弹性、软硬件结合的卓越性能以及内生的智能化能力,为上层智能应用和自主智能的发展提供了坚实且高效的数据基础设施,从而充分释放多模态数据在复杂业务场景中的价值。

    • 周文超
      阿里云
      数据库产品事业部总监,AnalyticDB PG及生态工具部负责人

      阿里云数据库产品事业部总监,AnalyticDB PG及生态工具部负责人,负责数据库生态工具与管控的研发以及数据库系统与内核方向科研,专注于Data+AI 场景下的数据库与分布式系统的架构和技术。曾任美国乔治城大学计算机系终身教授,在一流学术会议和期刊发表论文70 余篇,获EDBT 和SIGCOMM 的最佳论文和最佳系统实现奖等奖项,中国计算机协会(CCF)数据库专委会执行委员。

11:10-11:45
  • OceanBase 一体化演进之路:面向未来的数据底座

    数据库技术经历二十年快速演进,系统割裂与复杂度不断加剧。本次演讲将探讨数据库一体化之路:从分布式事务、HTAP、多模到SQL+AI的演进,既能承载核心交易,又能在降低技术栈复杂度、提升运维效率的同时,为实时分析与AI推理提供支撑,成为 Data × AI 时代的数据底座。

    • 韩富晟
      OceanBase
      首席架构师

      韩富晟,现任OceanBase团队首席架构师。作为 OceanBase 创始团队核心成员,他深耕技术一线,主导设计并研发了 OceanBase V4 一体化架构,推动产品实现跨越式发展。

11:45-12:20
  • AI驱动,向智而生:金篆数据GoldenDB铸就智能核心引擎

    在当今数字化浪潮中,核心引擎如何进化,才能驾驭海量信息、驱动智能决策?本次演讲聚焦“AI驱动,向智而生”,将为您揭示金篆数据GoldenDB如何铸就面向未来的智能核心引擎。 金篆数据GoldenDB拥有20余年研发沉淀与10余年重点行业深耕经验,手握超800项数据库核心专利,实现“AI×DB”双向驱动:在“AI for DB”层面,赋予数据库智能调优、智能诊断、智能规划等能力,提升自治水平;在“DB for AI”维度,支持多模数据处理,特别是向量计算,成为AI坚实底座。 目前,金篆数据库GoldenDB已在中国分布式数据库市场排名第一,在金融、运营商核心系统市场领先,助力政务、能源、交通、医疗等全行业系统平滑替代。

    • 屠要峰
      金篆信科
      副总经理

      待更新

专场1:数据库内核•技术创新
13:45-14:35
  • 从理论到实践:多模数据库技术演进与"KES多模数据一体化存储"架构剖析

    在 AI 技术迅猛发展的今天,应用系统正经历从多种单一服务向多场景智能交互的跨越,数据形态也随之呈现多模态并存的爆炸式增长,传统 “一种数据对应一种数据库” 的架构已陷入碎片化困境。如何打破数据孤岛,实现多模态数据的高效融合与价值挖掘,成为智能化时代的核心命题。 本次演讲将围绕多模数据库这一关键技术展开深度解析。首先,聚焦 AI 时代应用系统的变革趋势,剖析数据体系从 “烟囱式存储” 到 “一体化融合” 的必然转向。并通过分析业界主流多模数据库的技术演进路径 —— 从早期多引擎封装的 “多模 0.X时代”,到如今原生一体化架构的 “多模 2.0”,解析其技术路线的核心差异,探讨技术发展的主流方向。核心环节将深入拆解 “KES 多模数据一体化存储” 架构的技术内核创新:详解其在内核各主要模块实现文档、向量、时序等新增模型与关系模型数据的深度融合,展现从理论创新落地到工业级实践的完整链路。最后,展望 KES 多模数据库的未来演进,为企业把握数据技术前沿、构建高效数据底座提供实践参考。 

    • 张昊
      中电科金仓(北京)科技股份有限公司
      电科金仓产品经理

      张昊,电科金仓产品经理,当前目前主要负责金仓数据库产品与场景化方案设计与应用实践,以及向量、文档、图等多模态融合处理方向的产品规划。曾在新华三、华为、金仓担任解决方案架构师、产品经理等职,主持多个软硬件全栈解决方案与关键行业场景化方案的设计、应用实践与推广工作。

14:35-15:25
  • 数据库内核未来技术展望

    本次分享将从4个方面“高估的GPGPU、低估的RDMA、发展中的SIMD、统一的呼唤”,介绍软、硬件发展对数据库内核未来的影响。对于OLAP数据库来说,GPU虽然是算力核弹,但并发优势相比CPU到低如何?无论OLAP还是OLTP,内存墙的瓶颈不在于内存、也不是Channel带宽,而是“Reservation Station”(简称RS)大小,RS如何限制了内存带宽?数据库又有何应对之道?SIMD(矢量指令集)仅仅能用于向量数据库或OLAP分析类数据库吗?而OLTP数据库在现代处理器上真正的瓶颈又在哪里?本次分享从体系结构层面,展示研究数据库的一种方法,以及研究成果。

    • 吕海波
      北京大学
      数据库课程企业导师

      IT老兵,24年IT领域从业经历,十数年数据库经验,惯看IT江湖风起云涌。曾在多家巨头型互联网公司从事数据库管理与研究工作。2009年曾就任阿里巴巴高级数据库专家(P8),并于2014年以特招方式进入国际电商巨头ebay(ebay全球唯一无法英文听说的技术人员),从事数据库管理与研究工作。目前主要研究方向数据安全、数据库内核。出版技术书籍《Oracle内核技术揭密》,被誉为国内最深度解密Oracle算法原理的技术书籍。

15:25-16:15
  • PolarDB 高性能一体化Data+ AI平台

    介绍PolarDB 面向AI时代重要的演进方向,包括Data + AI平台架构,AI节点、AI存储、AI应用等各项加持能力,助力客户一站式构建核心AI应用。

    • 宋震
      阿里云
      数据库高级产品专家

      宋震,博士,研究员级高级工程师,阿里云数据库高级产品专家,江苏省333高层次人才培养工程培养对象,南京市有突出贡献中青年专家,长期从事时空数据库与时空大数据技术研究,成果先后获得江苏省科学技术奖、国土资源部科学技术奖多项。

16:15-17:05
  • 跨越2038:MySQL时间戳的未来

    应对MySQL时间戳Y2038问题:前瞻性解决方案与携程实践。本次技术分享聚焦于如何应对MySQL中著名的"2038时间戳危机"解决方案。由于MySQL TIMESTAMP类型采用32位二进制存储机制,其可表示的时间范围存在严格上限(2038-01-19 03:14:07 UTC)。当系统时间跨越2038年临界点时,所有依赖TIMESTAMP类型的数据库操作将面临数据溢出风险,导致业务系统出现不可预测的错误行为。这一限制将全面影响涉及未来时间计算的业务场景,比如:长期订阅服务、产品预计算、设备生命周期管理等关键业务模块。考虑到线上数据库架构改造通常需要跨年度的规划周期(涉及应用适配、数据迁移、测试验证等多个阶段),有必要提前开始建立技术预案,确保业务不受影响。 本次主要围绕以下内容进行分享: 1) Y2038问题背景和简介 2) MySQL时间戳存储限制 3) 临界点突破后业务影响评估 4) 当前主要解决方案 5) 携程目前具体实践 正如当年全球协作解决千年虫问题一样,面对2038年的技术临界点,我们也需要:打破企业间的技术壁垒,共享最佳实践方案,甚至建立行业协作机制。期待通过这次开放讨论,能够碰撞出突破性的技术思路,为行业探索出一条平稳过渡的数字时间航道。

    • 郜德光
      携程旅行网
      数据库总监

      2012年加入携程DBA团队,一直负责数据库相关运维和架构设计等工作,期间主导完成多项关键数据库相关基础设施升级项目。

专场2:数据库自主可控之路-(上)
13:45-14:30
  • 根技术突破,崖山数据库筑基关键业务系统

    在国产化加速、数据库技术多元发展的趋势下,企业对自主可控、场景适配的数据库需求迫切,却面临产品能力不足、依赖资源堆砌、综合成本高等挑战。本次分享将介绍崖山数据库如何通过自研内核技术与共享集群架构实现破局,助力企业在性能不减的同时,降低迁移与运维等总体拥有成本,同时满足金融、政务等关键领域对安全可控的严苛要求, 为自主数据库技术发展开拓新途,展望更广阔自主创新未来。

    • 孟凡彬
      深圳计算科学研究院&崖山科技
      YashanDB集群首席架构师

      毕业于西安电子科技大学计算机专业,拥有十余年数据库内核领域的研究与研发经验。长期深耕数据库事务机制、存储引擎优化及集群架构设计等核心技术领域,斩获多项数据库相关技术专利。 现任深圳计算科学研究院&崖山科技YashanDB 集群首席架构师,负责产品的架构设计与内核技术研发。作为技术核心带头人,主导全自研崖山共享集群数据库产品实现从 0 到 1 的架构突破,攻克多项关键技术难题,带领团队完成产品化落地闭环。

14:30-15:15
  • 交易永不断,数据零丢失,GBase 8s赋能金融行业核心系统信创改造

    在金融行业核心业务系统信创改造过程中,数据连续性与安全性至关重要,GBase 8s凭借完备的高可用方案,稳定的性能表现,高兼容性等特点为金融机构提供牢固的业务信创底座,助力金融机构在自主可控道路上实现业务连续性与数据安全双保障。

    • 郭茁
      南大通用
      GBase8s 产品部长

      2015年加盟南大通用,副高级职称。长期从事GBase8s产品的产品管理和项目管理的相关工作。参与了GBase8s多个版本的产品规划、需求调研等相关工作,长期在OLTP场景下深耕研究。在数据库高可用的研究上有很多独到的见解。

15:15-16:00
  • 腾讯云TDSQL在国有大行的技术演进路线

    TDSQL在国有大行攻坚阶段一方面面临大行本身承担的特殊社会责任和影响,另外一方面大行业务规模带来节点规模的复杂度呈指数级上涨。因而在数据库高可用,数据强一致以及性能等方面面临全方位的挑战。本次分享将介绍作为深耕银行核心系统的TDSQL在攻坚大行的过程中持续演进技术路线,沉淀出了多数派方案,一致性读取,HA保活等系列核心能力,为大行核心业务上线实现保驾护航。

    • 张文
      腾讯云
      数据库研发专家

      张文,腾讯云数据库专家,主要聚焦数据库私有化部署形态下高可用、数据强一致、易用性以及数据安全性等问题的解决。从0到1完成了TDSQL第一个金融核心的商业化案例,支撑了平安、招行、中行、农行等数据库核心业务。

16:00-16:45
  • 数字化管理转型协同数据架构升级

    将全行客户信息进行统一管理,整合交易、行为数据,构建客户全景视图。客户信息平台、营销平台以及绩效平台向中台转型,PostgreSQL集群、ES,Redis、Hadoop,Spark流批一体,支撑客户精准营销,实时计算绩效,实现“以客户为中心、自主可控、流批融合”的新一代数据架构。

    • 韩丹
      中国邮政邮储银行软件研发中心
      项目管理

      曾就职于思科研发中心,担任Oracle DBA, DevOps Scrum Master,现就职于中国邮政邮储银行软件研发中心负责项目管理。

16:45-17:30
  • 金融行业数据库的演进

    一、金融行业数据库的演进经历了从依赖传统商业数据库(如Oracle、DB2)到逐步转向国产数据库的历程。 二、早期,金融机构普遍采用国外数据库,以满足高并发、高可靠的需求,但存在成本高、技术受限等问题。 三、随着国家对信息安全的重视及技术的突破,分布式、开源及国产数据库(如OceanBase、TiDB、达梦)崛起,凭借高性能、高可用和自主可控的特性,逐步替代传统方案。 这一变迁不仅降低了成本,更推动了金融科技自主创新,为行业数字化转型奠定基础。

    • 姚伟
      某金融企业
      资深DBA

      在零售、金融、互联网行业从事数据库相关工作10余年,有丰富的数据库管理和架构的相关经验。 涉及SQLServer、Oracle、MySQL、PostgreSQL、DB2等多种数据库,精通SQLServer高可用架构。 同时涉及大数据相关工作,参与并搭建了企业的大数据平台。目前在某头部金融企业担任资深DBA。负责整个公司数据库和大数据的架构设计和管理工作。

专场3:融合数据库技术与实践
13:45-14:35
  • “我”与“AI”—从DBA到DBA²

    AI与数据的融合正深刻改变着行业,如何洞察其本质,将前沿趋势转化为真实的业务价值,是所有企业面临的核心课题。本次分享将结合实践经验,从大模型底层逻辑出发,剖析其与数据库结合的价值潜能与现实挑战。核心议题将聚焦于一套决策方法论(“我”与“AI”四象限),探讨如何通过构建新一代的人才能力(从DBA到DBA²),来驱动数据价值的有效增长。

    • 梁敬彬
      知名企业
      数据专家

      曾任中电福富研究院副理事长、中盾安信研究院副院长、宁德时代技术顾问等职务,曾受聘电信集团专家、国家十四五课题负责人。乐于分享,著有《收获,不止Oracle》《收获,不止SQL优化》等畅销书。

14:35-15:25
  • ClickHouse 在 AI 领域的进展和应用

    随着AI和大数据应用的快速发展,企业面临着多重挑战:传统数据库在处理大规模向量搜索时性能瓶颈明显,RAG应用需要高效的向量存储和检索能力,机器学习数据管道缺乏统一的管理平台,同时可观测性数据的实时分析需求日益增长。这些挑战促使我们探索ClickHouse在现代数据架构中的创新应用,特别是在向量搜索、智能代理分析、机器学习数据管理等关键领域的突破。

    • 王鹏程
      ClickHouse Inc
      技术总监

      王鹏程 - CovenantSQL 和 chDB(被 ClickHouse Inc 收购) 的作者 - 代码贡献者 ClickHouse, Jemalloc, K8s, Memcached, CockroachDB, Superset - 从零构建了多家上市公司的基础架构 - 历任360、艺龙、第四范式基础架构总监,CovenantSQL CTO,Shopee 搜广推首席工程师 - 现任 ClickHouse Inc 技术总监

15:25-16:15
  • 打通数据孤岛-芒果TV异构数据平台集成实践

    随着芒果TV业务快速扩张,内容生态、用户行为、运营分析、推荐算法等场景所依赖的数据类型愈发多样,数据源异构化问题日益突出。面对海量、多源、分布式的数据系统,如何实现高效、稳定的数据整合,成为支撑业务创新和数据驱动决策的关键。 本次演讲将分享芒果TV在异构数据平台集成方面的技术演进与落地实践,聚焦数据源接入的统一规范、实时与离线的融合处理、数据链路的稳定性保障等核心问题。从实际业务痛点出发,讲解如何搭建可扩展、可观测、可维护的异构数据接入与整合框架,帮助企业打通“数据孤岛”,释放数据价值。 分享大纲: 1.业务背景与挑战 芒果TV多元数据源现状及典型使用场景 异构数据带来的技术与组织难题 2.系统架构设计 异构数据接入统一架构概览 实时与离线融合的数据处理机制 数据标准化与质量治理策略 3.关键技术实践 多源接入方案设计(Kafka、MySQL、TiDB等) CDC、流式处理、任务编排等关键组件的选型与优化 高可用与链路稳定性保障方案 4.落地效果与未来演进 集成平台支撑的典型业务价值体现 面向未来的架构优化方向与演进计划

    • 刘波涛
      芒果TV
      智能媒资中心-数据技术负责人

      曾任芒果TV资深后端架构师、资深大数据架构师,现任芒果TV数据技术负责人,长期专注于大数据平台架构设计、大数据OLAP引擎研发、数据处理性能优化与系统稳定性建设等方向,具备丰富的企业级系统实战经验。 曾担任 Elasticsearch 中国开发者大会讲师、StarRocks Summit 2023 大会讲师,2024 年获评 StarRocks 社区“年度杰出贡献人物”,在社区建设、开源项目推动等方面表现突出。

16:15-17:05
  • 超融合数据库:多模引擎如何终结“数据烟囱”时代

    待更新

    • 王丁丁
      BOE京东方
      数据平台负责人

      网名:IT邦德。中国DBA联盟(ACDU)成员,Oracle PostgreSQL ACE,墨天轮MVP,PolarDB开源社区技术顾问。通过Oracle 19C OCM、MySQL8 OCP及工信部PCP、阿里OBCP、华为高斯OGCA等认证,CSDN博客专家及B站知名UP主,全网粉丝10万+,出版书籍《MySQL职场私房菜》。目前服务于工业互联网,10余年DBA运维经验,擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复,安装迁移,性能优化、故障应急处理。

专场4:AI For DB(上)
13:45-14:30
  • AI编程对数据库AI运维的启示

    随着AI技术的发展,在AI编程领域已经出现了大量的优秀产品,cursor/trae/通义灵码/code buddy等纷纷出台。未来,AI也必将让数据库使用和维护变得更加便捷。本演讲包含以下章节:1、数据库运维的变迁,从制度化到智能化 2、AI辅助数据库运维的技术探索 3、AI加持下数据库运维人机接口的变迁 4、总结

    • 白鳝
      佰晟智算
      CEO

      曾供职于DEC深圳研发中心、赛格计算机有限公司、长天集团、联想金融事业部等。 在软件开发、系统运维、信息系统优化、信息系统国产化替代等领域从事技术研究近30年,曾主持开发了国内首套电信级联机实时计费系统、国内首套三检合一的检验检疫管理系统、银行综合大前置平台(IPP)等大型系统。著有《Oracle RAC日记》、《Oracle DBA优化日记》和《DBA的思想天空》等技术专著。信息无障碍研究会专职顾问,深圳市鲲鹏产业联盟高级顾问,Oracle ACE,POSTGRESQL ACE DIRECTOR。

14:30-15:15
  • DAS Agent 大模型驱动的下一代数据库运维新范式

    阿里云DAS(Database Autonomous Service)全新发布 DAS Agent助手,结合百万诊断&处置经验,自研运维增强大模型;DAS Agent 具备预防-发现-定位-诊断-修复-观察的数据库全域管理能力,实现7*24小时的全链路看护,为DBA配备一个永远在线的“靠谱”助手。

    • 陈茏久
      阿里云
      数据库高级产品专家

      阿里云数据库高级产品专家,数据库生态工具产品负责人.

15:15-16:00
  • DBdoctor:SQL诊断优化智能体,一分钟解决数据库问题

    本次分享将重点介绍如何构建数据库性能诊断与优化智能体,包含智能SQL审核、SQL性能评估、SQL性能优化、SQL改写、根因诊断等核心功能的实现原理与落地实践。分享中也会重点介绍性能诊断与优化这种高精准度要求的场景如何避免大模型幻觉,实现一分钟定位并解决数据库问题。 分享大纲: a.根据当前的行业发展现状,深度剖析当前构建数据库性能诊断与优化智能体时存在的问题 b.阐明DBdoctor数据库性能诊断与优化智能体所具备的技术优势,并深入阐述技术实现原理 c.详细介绍DBdoctor数据库性能诊断与优化智能体在各个具体场景的落地实践 分享要点: 首先深度剖析当前构建数据库性能诊断与优化智能体时存在的问题,如:如何保持改写前后的语义一致性,如何验证改写的性能提升等等。 然后给出DBdoctor对于上述问题的应对策略(基于eBPF的外置cost优化器、SQL等价关系代数转换),并详细阐述该部分关键技术的实现原理。 最后详细介绍DBdoctor数据库性能诊断与优化智能体在各个具体场景的落地实践。

    • 辛全琦
      海信聚好看科技股份有限公司
      DBdoctor研发负责人

      数据库技术爱好者,专注于数据库产品研发,负责数据库云化和数据库产品建设,数据库性能诊断产品DBdoctor研发负责人,该产品目前可在官网免费下载使用。聚好看就职期间主导数据库智能自治在公司的全面落地,带领研发团队突破细粒度监控数据采集,精准SQL代价评估,智能SQL优化等一系列难题,实现数据库运维效能的大幅度提升。

16:00-16:45
  • 基于深度强化学习的数据库自动优化研究

    聚焦于利用深度强化学习技术解决数据库物理设计中的核心问题,包括索引推荐、物化视图创建和数据分区。传统数据库物理优化方法(如人工调优、贪心算法)面临 NP-Hard 问题复杂度、动态负载适应性差等挑战,而深度强化学习通过 “试错 - 学习” 机制,能够高效建模高维非线性关系,优化数据库性能。本研究提出了一套融合强化学习的自动化物理优化框架,在静态和动态负载场景下均实现了优于传统方法的性能提升,为云数据库自动化调优提供了理论与实践支持。 分享大纲: 1.数据库自动优化的重要性以及现有方法的不足 2.深度强化学习在数据库自动优化中的应用 3.实验验证与结果分析 4.总结与未来展望

    • 崔鹏
      海能达通信股份有限公司
      数据库团队负责人

      崔鹏,计算机学博士,主要研究方向AI与大数据管理。PostgreSQL中文社区核心成员,公众号CP的PostgreSQL厨房作者,拥有十年数据库、操作系统、存储领域的工作经验,ORACLE OCM、MySQL OCP。目前任海能达通信股份有限公司数据库团队负责人,从事数据库高可用、高性能以及AI在数据库领域的应用,方面的研究工作。PostgreSQL ACE、MVP。 专著《PostgreSQL高可用实战》作者 学术成果3篇SCI 1.Article Stepwise Attention-Guided Multiscale Fusion Network for Lightweight and High-Accurate SAR Ship Detection. 2.An advanced lightweight network with stepwise multiscale fusion in crowded scenes. 3.Dynamic Pixel Attention Aggregating Network for Efficient Segmentation in Remote Sensing Image.

16:45-17:30
  • DBRE与AI:智能驱动数据库管理效能提升

    从DBA进化到DBRE,我们如何借助AI在数据库管理工作的各个方面提升效能。

    • 严少安
      Oracle
      ACE

      Oracle ACE-A,TiDB TiExplorer、社区版主、MOV,PostgreSQL ACE Partner,墨天轮 MVP,ITPUB 专家博主,HaloDB外聘技术顾问。

定制专场:南大通用GBase 8s从内核重构到生态自立的突破之路
14:00-14:30
  • 深圳地铁AFC系统创新业务场景及国产信创数据库应用实践

    深圳地铁售检票系统是全国轨道交通唯一一个从后台到前端全面采用国产信创数据库的机电系统。本次分享深圳地铁如何通过应用多项行业首创和领先技术实现“降本增效提智”的创新目标,为我们的乘客提供更加便利高效的出行服务。

    • 马怀清
      深圳地铁建设集团有限公司

      高级工程师,信息系统项目管理师,现任深圳地铁建设集团有限公司机电设备部总监,同时任深铁建设“青年专家型人才小组”AFC专业组组长。主编/参编多项轨道交通售检票专业国家标准和行业规范、主持/参与多项科研项目,多项科研成果实际应用于深圳地铁项目。 荣获2019德国iF DESIGNAWARD 2019工业设计奖; 荣获2020年中国信息产业商会创新应用大赛银奖; 荣获2022年中国交通运输协会科技进步奖; 荣获2024年深圳市计算机行业协会一等奖。

14:30-15:00
  • GBase 8s这十年

    介绍GBase 8s的技术演进路线;介绍8S产品的优秀产品能力,包括,主备式集群的能力和特点、8s共享存储集群的能力、8s基于表复制的数据交换共享能力。介绍8s在oracle和mysql的语法兼容性的相关能力。介绍8s的周边生态,包括驱动支持,C语言方法接口程序、ORM框架和中间件的支持,介绍8s的配套工具:统一的监控运维工具、客户端工具、迁移工具等。

    • 崔志伟
      GBase 8s产品经营部总经理

      从事数据库相关行业20年,服务过部委、运营商、银行的核心数据库等。带领团队完成oracle语法兼容、主备集群防脑裂套件、8s的生态工具开发,包括统一监控和运维平台、客户端工具。

15:00-15:05
  • 抽奖(三等奖)
15:05-15:35
  • GBase 8s引擎重构的成果和经验分享

    GBase 8s近年来围绕用户生产场景,秉承务实精神,持续深入理论研究与工程化实践。今年7月,GBase 8s新存储引擎正式发布。新引擎提供内存化的高性能多版本并发控制,通过重构事务处理大幅提升高并发性能,在实现备节点一致性读的基础上极致缩短主备切换时间,同时提供更全面的DDL Online、急速闪回等生产能力。后续,将深度贴合国产CPU和操作系统,持续加快演进。

    • 杨蔚
      GBase 8s研发负责人

      GBase 8s研发负责人,深耕基础软件领域20余年。历经操作系统、通信产品、DBaaS及数据库内核等领域的研究与研发工作,实现0到1的打造。带领团队完成了GBase 8s新一代存储引擎的设计与研发工作,并将带领团队持续推动GBase 8s的技术演进。

15:35-16:05
  • 从可用到可靠,GBase 8s高可用集群解决方案

    GBase 8s数据库集群提供全套对标Oracle的高可用解决方案,我们将探讨共享存储集群如何实现资源高效利用与故障秒级切换,解析主备复制集群的数据同步与容灾能力,展示数据实时交换共享解决方案如何打破信息孤岛。 通过金融、政务等领域的真实案例,分享不同集群架构在生产环境中的最佳实践,助力企业构建稳定高效的数据库架构。

    • 霍增辉
      华为云
      数据库高级技术专家

      霍增辉,资深数据库专家,拥有10年数据库运维、优化及测试经验,熟悉Informix/MySQL/Oracle等多种数据库技术。先后负责过GBase 8s产品售前、售后、POC、项目管理等多类工作,对数据库产品全生命周期有充分了解。擅长技术方案落地与跨团队协作,以扎实的技术功底和丰富的实战经验为客户提供高可靠数据库解决方案。

16:05-16:10
  • 抽奖(二等奖)
16:10-16:40
  • 数据库生态-从技术孤岛到协同共生

    数字化转型浪潮下,破除数据库技术孤岛成为企业高效协同的核心命题。GBase 8s 以开放内核为基石,深耕生态建设:全面兼容主流开发框架,消除技术对接壁垒;深度适配全国产化软硬件技术栈,筑牢自主可控底座。通过构建涵盖合作伙伴与广大用户的繁荣生态网络,实现技术资源高效流转。从孤立系统到协同共生,GBase 8s 持续赋能企业业务敏捷响应与可持续增长。

    • 郭茁
      GBase 8s产品部部长

      2015年加盟南大通用,副高级职称。长期从事GBase8s产品的产品管理和项目管理的相关工作。参与了GBase8s多个版本的产品规划、需求调研等相关工作,长期在OLTP场景下深耕研究。在数据库高可用的研究上有很多独到的见解。

16:40-16:45
  • 抽奖(一等奖)
定制专场:华为云数据库,打造AI时代智能数据新底座
13:45-13:50
  • 开场致辞
13:50-14:10
  • 深耕数据库根技术,打造可持续演进的智能数据新底座

    华为云数据库2025年全系产品升级,GaussDB稳、TaurusDB快、GeminiDB全。面向企业传统核心,GaussDB全新透明多写架构,性能、可用性、资源利用率三重倍增;面向互联网业务,TaurusDB AI-Based Serverless打造极致性价比;面向原生AI应用,GeminiDB打造多模融合统一数据底座,加速企业从数字化生产系统演进到AI化生产系统。

    • 张浩
      华为云
      数据库产品规划负责人

      负责华为云数据库的产品组合管理策略管理、战略及产品规划等工作。2014年加入华为,在数据库领域拥有丰富的产品营销及规划经验。

14:10-14:30
  • GaussDB池化透明多写架构:实现性能、弹性与可靠性的三重突破

    当前主流的云数据库采用存算分离的架构支持一写多读能力,需要区分读写,业务很难做到透明使用,且写能力不能很好扩展。GaussDB透明多写架构实现分层弹性扩展,通过GaussStor分布式存储实现数据共享,使得每个计算节点都可以访问全部数据;通过分布式缓冲池,分布式锁,Lamport时钟等技术实现计算节点对等透明读写能力;

    • 张金玉
      华为
      数据库高级技术专家

      从事数据库研发工作16年,专注于数据库存储引擎技术,先后完成内存数据库引擎,列存数据库引擎和行存数据库引擎设计开发,当前负责GaussDB透明多写架构设计。

14:30-14:45
  • 工商银行×GaussDB:打造金融行业数智化转型标杆

    • 吴辉
      中国工商银行
      数据中心系统三部副总经理

14:45-15:05
  • TB级数据实战:GaussDB大容量性能优化和维护挑战

    随着数据规模的增大,当热数据规模超过缓冲区大小时,I/O成为瓶颈,性能随着访问数据的增大而持续下滑,并且伴随着性能波动幅度的明显增加。与此同时,运维挑战也接踵而来,对于数据库的重构/重建/备份都带来很大挑战。

    • 陈玉标
      华为
      数据库高性能存储专家

      从事数据库研发工作4年,专注于数据库存储引擎,先后从事行存储引擎设计开发、物理扩容设计开发、用户态存储引擎开发,当前负责GaussDB大容量专项设计。

15:05-15:25
  • 慢SQL治理新范式:动态索引管理与智能查询重写的协同进化

    随着现代应用复杂查询的激增,以及‌云原生数据库环境的透明性,使得传统的慢SQL优化方式存在很大的局限性。本次分享将围绕性能‌根因分析、负载预测、优化规则自动发现、语义等价性验证等技术下的‌动态索引管理与智能查询重写来实现慢SQL优化从单点到全链路的智能治理、从人工到自动化的效能跃迁。

    • 徐华华
      华为云
      数据库高级技术专家

      专注于数据迁移、语法兼容性改造, SQL优化改写等技术研发, 先后担任DRS、UGO等服务的系统架构师,负责数据库迁移工具的技术规划与演进, 带领团队完成了十数个行业Top用户的上云与国产数据库替换项目的方案设计和实施。

15:25-15:45
  • TaurusDB云原生数据库:极致弹性与性能优化的技术实践

    云原生数据库的核心目标是实现极致弹性,并提供高效的单位资源处理能力,帮助用户实现云上低成本高体验的快速使用数据库服务。 TaurusDB作为华为云的云原生数据库服务,在高性能与极致弹性上持续优化,主题将介绍TaurusDB做了哪些背后的工作,来帮助客户获得极致弹性的使用资源;以及TaurusDB在性能上做了哪些优化点,帮助用户提升使用性能,并且从实践案例的角度建议用户如何优化性能。

    • 彭立勋
      华为云
      数据库软件总工程师

      主要负责MySQL产品和云原生引擎架构。ACMUG(中国MySQL&MariaDB用户组)主席,中国计算机行业协会数据库专委会秘书长,MariaDB基金会成员和Committer。MySQL/MariaDB社区多源复制、闪回等特性的开源贡献者,特性在社区中被广泛应用。

15:45-16:00
  • 宝宝树×TaurusDB:智慧赋能,共筑母婴家庭幸福未来

    作为国内领先的母婴社区平台,宝宝树始终致力于为用户提供更优质的服务。面对日益增长的数据量和业务需求,宝宝树选择携手华为云TaurusDB完成数据库升级,实现业务能力的全面跃升。通过创新的存算分离架构,彻底解决传统MySQL复制延迟问题,并支持资源弹性伸缩,显著提升资源利用率。迁移过程中,华为云DRS服务通过1:1流量回放技术确保数据零丢失、业务零中断。升级后系统性能实现跨越式提升,较开源MySQL性能提升2倍,为千万母婴家庭带来更流畅的社区互动体验和更可靠的数据服务,用科技赋能智慧育儿新时代。

    • 张建辉
      宝宝树
      宝宝树(北京)信息技术有限公司DBA

      10年+DBA生涯,Oracle转型MySQL,任职于MRO上市公司、在线教育行业,现就职于宝宝树4年+。

16:00-16:20
  • GeminiDB T+0实时车联网方案,实时处理千万级车辆数据

    数据是车联网智能化的核心要素,数据库作为最核心模块,提供不同类型数据处理。随着车辆接入量的不断增长、数据采集频率要求越来越高,车联网数据爆发式增长。如何实时、低成本的处理海量车辆数据是企业面临的问题。华为云多模数据库GeminiDB针对车联网企业普遍面临的海量数据无法实时写入、实时数据分析难、乱序数据处理难度大等挑战,提出了T+0实时车联网解决方案,让企业存储成本降低的同时,提升了数据处理能力,实现了车辆海量数据的实时、低成本处理,帮助客户更好地实现高价值业务。

    • 胡亚凡
      华为云
      华为云GeminiDB服务域总监

      华为云GeminiDB服务域总监,在数据库和分布式存储领域具有超过12年的深厚研发经验,曾任职 IBM 与阿里巴巴,担任数据库技术专家,专业领域涵盖分布式系统、数据一致性、高可用架构以及存储引擎的创新。

16:20-16:35
  • 微财数科×GeminiDB:智能广告投放系统的“加速度”

    在数字化营销时代,广告投放的实时性和精准性直接决定了业务增长效率。微财数科基于RTA(Real-Time API)技术构建的智能广告投放系统,面临海量用户行为数据实时分析、高并发低时延响应、以及亿级数据快速入库等核心挑战。本次演讲将深入分享华为云GeminiDB如何通过高性能、低时延、DBLoad等核心竞争力,成为微财数科RTA系统的“核心加速器”,助力其实现广告转化率提升与成本优化的双重目标。

    • 杨智欣
      北京微财科技有限公司
      北京微财科技有限公司技术总监

      毕业于北京航空航天大学,软件工程硕士学位,曾就职于阿里巴巴以及滴滴一线互联网公司,目前在微财数科主要负责业务研发工作。

16:35-16:50
  • 安图特×华为云数据库,携手共建繁荣的数据库生态

    安图特作为华为云数据库的重要生态合作伙伴,提供涵盖“咨询、迁移、运维”的全栈服务,并推出ALL To GaussDB数据迁移解决方案。该方案已在金融、政府、能源等多个行业项目中成功落地,依托数据库智能管理平台,全面提升数据库运维管理水平,实现1-5-10的运维能力。

    • 蔡勇
      安图特(北京)科技有限公司
      副总裁、技术总监

      安图特(北京)科技有限公司副总裁、技术总监,在基础软件运维、系统架构设计、容灾解决方案、数据保护及国产信创替代技术领域深耕20多年,曾参与首批银行大前置系统建设及项目管理,成功实现AIX、HPUX平台上的Oracle、Sybase数据库部署及数据迁移。于2025年加入高斯数据库专业委员会。

大会主场:智能创新 数赢未来
09:00-09:45
  • 创新驱动领数智潮头,协力同行筑开源未来

    openGauss是面向数字基础设施的开源数据库,开源五年以来,在社区伙伴、开发者们的共同努力下,在技术上、生态上、商业上取得了一系列显著的成果。2024年openGauss系数据库在线下集中式新增数据库场景的市场份额占到了30.2%,2025年,预计该新增市场份额将达到35%以上。此次演讲,openGauss研发总监熊钦将为与会嘉宾们分享openGauss社区开源五年以来的各方面发展成果,重点围绕技术竞争力,讲述openGauss如何协同社区伙伴在各项数据库领域的核心技术上持续迭代创新,在生态上如何协同伙伴们共同发展,致力于成为数据库行业的坚实底座。 分享提纲: a. 介绍openGauss当前社区发展成果; b. 介绍openGauss 7.0.0版本的技术优势; c. 重点聚焦产品竞争力,展开讲解使能RAG的DataVec向量数据库、oGRAC多写架构、内核特性、四高能力等; 分享要点: 首先,通过介绍openGauss当前社区发展成果,展现openGauss社区整体活跃度与各伙伴技术参与度; 其次,分享openGauss坚持开源开放、技术创新,oGRAC多写架构是业界首个开源的多写数据库;DataVec向量数据库助力打造高性能、高可靠、高安全RAG解决方案; 最后,介绍当前生态发展情况,与开发者共建共享共治自主创新根社区,成为面向数字基础设施的多场景开源数据库,未来将持续围绕技术创新,成为数据库行业的坚实底座。

    • 熊钦
      华为技术有限公司
      华为计算产品线鲲鹏领域openGauss研发总监

      熊钦,现为华为计算产品线鲲鹏领域openGauss研发总监,华中科技大学工学博士,具有长期的大数据、编译器等领域研发经验和技术积累,对数据分析、处理器、体系架构等具有广阔的技术视野。

10:20-11:00
  • 数据库架构重塑

    数据库技术已经发展了七十余年,对于一个人而言,已然不再年轻;但对于一个重要的软件产品而言,数据库产品是否已经变老?如果其没有变老,其永葆青春的秘密在哪里?如果已经变老,那么是什么已经步入暮年? 数据库产品,是否可以重新焕发第二春?其生命力在哪里?什么可以使得数据库脱胎换骨、再塑辉煌? 本分享,从数据库的重要的、核心的基础问题谈起(并发环境下:数据的正确性和系统的性能),涉及数据库最重要的理论和技术(可串行化理论和事务处理技术),分析其成功和不足之处,辨析其对数据库架构的影响(事务处理技术和架构之间,又有什么关系?),从而提出新一代数据库架构的设计理念,并基于该理念分享工程实践的产品——C2DB的架构——从而把数据库架构重塑的内涵和外延一一阐述、娓娓道来。 分享大纲: 1.历史上,数据库架构的发展,是曲折的、还是有设计指导的? a)整体设计与模块设计 b)数据库的几种架构 2.为什么需要重构数据库的架构? a)重度耦合导致逻辑不清晰 b)重度耦合导致系统不具备普适性 c)“一致性与并发”是普遍,是事务层面的最高抽象,是并发系统的最高抽象,是世界的“大道法则” 3.如何重构数据库的架构?---并发系统设计三原则 a)原则1(优先原则) b)原则2(解耦原则) c)原则3(独立原则)

    • 李海翔
      中国人民大学
      企业导师

      李海翔。中国人民大学、北京林业大学硕士企业导师;CCF数据库专委会、大数据专委会执行委员;DTCC、CSDN专家委员。前腾讯、字节跳动、华胜天成、Oracle等公司数据库首席架构师。录用多篇数据库顶会顶刊论文,出版《数据库查询优化器的艺术:原理解析与SQL性能优化》、《数据库事务处理的艺术:事务管理和并发访问控制》、《分布式数据库 原理、架构和案例》等著述。申请与授权专利100+,获中国发明专利金奖、广东省发明专利金奖。获北京市、深圳市科技进步一等奖。参与包括国家863重大专项、核高基、工信部、科技部等重大科技项目。

11:00-11:40
  • 金融全场景应用数据库创新实践

    本次演讲介绍覆盖金融全场景、全流程应用数据库创新最佳实践,包括: 1)覆盖全流程的数据库创新方法论 2)数据库优化方法论创新 3)后信创时代SQL治理方法论 4)优化实战案例分析

    • 林春
      太平洋保险数智研究院
      首席数据库专家

      目前是中国太保集团数智研究院首席数据库专家,负责全集团数据库数字化转型全链路技术支撑工作。《金融数据库转型实战:基于OceanBase》作者;负责核心系统数据库国产化分布式数据库技术攻坚,实现金融行业深度绑定Oracle特性、海量核心系统数据库国产化首次里程碑突破;自研国产数据库改造工作量预评估工具“指南针”,弥补业界空白,提升应用改造效率约25%,累计节省成本数千万。OceanBase OCEC客户专家委员会专家委员;获得OceanBase OBCE、Oracle OCM、Postgresql PCM、MySQL OCP认证;曾任oracle wdp ocm讲师,国内前400个OCM教出约50~60人、DB2china性能调优版版主、PG社区PCM金牌讲师。

11:40-12:20
  • 如何构建业务领域专用智能体?

    1.明确构建价值与目标:点明通用智能体的局限,通过医疗、法律等案例展现业务领域专用智能体在提升效率、降低成本、优化决策等方面的显著价值,明确演讲将系统性讲解构建方法。 2.聚焦关键构建要素:构建涉及需求分析、数据准备、模型选择与优化、技术架构搭建四大关键要素。需求分析要明确业务目标、挖掘用户痛点;数据准备需注重收集与清洗标注;模型要适配业务并微调;技术架构要完成硬件软件配置与系统集成。 3.细化实践全流程:实践步骤包含规划、开发、测试优化、部署维护阶段。规划阶段制定计划、调配资源;开发阶段处理数据、训练模型、开发系统;测试优化阶段进行功能与性能测试并迭代;部署维护阶段确定部署方式、建立监控机制。 4.剖析挑战与对策:构建面临数据隐私安全、模型泛化能力、成本控制等挑战。对应可采用加密匿名保护数据、迁移学习等优化模型、合理规划资源降低成本。 5.展望发展趋势:未来,专用智能体将与物联网、区块链等技术融合,催生更多场景;低代码 / 无代码构建降低门槛;在更多垂直领域深度渗透,推动业务创新变革。

    • 常耀斌
      中国国新集团
      国新健康数字办主任

      常耀斌,国新健康数字办主任和AI中心副主任。20年企业级大数据和AI平台的管理和实战经验,曾就职华为技术公司,中国移动集团研究院,爱康集团等。历任首席架构师、技术总经理、AI科学家,CTO等企业高管。

专场5:分布式数据库性能最佳实践
13:45-14:30
  • 汽车之家分布式数据库应用实践

    随着业务持续增长,传统数据库架构面临容量瓶颈、运维复杂等挑战。汽车之家在核心系统中逐步引入分布式数据库TIDB,替代传统SQL Server/MySQL架构,实现业务系统的性能及稳定性跃升。 本次演讲度解析汽车之家在分布式数据库选型、规模化应用(覆盖论坛、实时报表、高并发互动场景)及运维升级中的工程实践,分享HTAP、跨机房双活、自动化运维等关键技术落地经验,为企业级数据库选型与落地提供实战参考。 主要内容: 1、业务增长下的数据库瓶颈 2、分布式数据库选型 3、汽车之家分布式数据库应用场景 4、规模化应用实践 5、总结与展望

    • 陶会祥
      汽车之家
      数据库专家

      陶会祥,汽车之家数据库专家,有较资深的数据库从业经验。在数据库运维体系建设,分布式数据库、跨数据中心多活等领域有丰富经验。

14:30-15:15
  • TDSQL-MySQL分布式查询优化和处理技术解析

    分布式数据库 TDSQL MySQL 已经广泛应用于国内各个金融机构,但 2.0 的分布式查询查询优化和处理较为简单,对复杂查询的处理能力有限,为了解决这个问题TDSQL MySQL 2.5版本中引入新的分布式查询优化和处理架构,大大增强了复杂查询的性能,本次分享将介绍新的TDSQL MySQL分布式查询优化和处理架构核心技术实现。 分享提纲: a. TDSQL MySQL当前版本在分布式查询优化和处理上的问题和限制 b. TDSQL MySQL新的分布式查询优化和处理设计思想和整体框架 c. 对TDSQL MySQL新的分布式查询优化和处理架构核心技术进行详细阐述 分享要点: 首先,通过介绍当前版本TDSQL MySQL分布式查询优化和处理过程来阐述当前实现的局限,并给出新架构要解决的关键问题 然后,从整体构架入手,从整体到局部逐渐分解,对新架构的各个模块的核心技术做详细的阐述。

    • 王殿成
      腾讯云
      数据库内核研发专家

      王殿成:多年数据库内核和操作系统开发经验,曾先后就职于人大金仓、阿里云,多年从事数据库内核开发工作,对开源数据库MySQL和PostgreSQL内核代码有深入的研究,现为腾讯云数据库内核研发专家,主要负责TDSQL-MySQL数据库内核分布式查询执行架构的设计和开发。

15:15-16:00
  • 中国移动磐维数据库在核心计费系统的应用实践

    磐维数据库是中国移动首个基于本土开源数据库打造的自研数据库产品,面向ICT基础设施领域,具备高性能、高可靠、高安全、高兼容等特点。此次新一代计费系统基于磐维数据库正式上线,标志着中国移动磐维数据库在核心业务系统规模应用领域取得重大突破,打造了可推广复制的“国产数据库替换标杆”。

    • 付慧军
      中国移动数智化部数据库研发中心
      OLTP数据库架构师

      付慧军,中国移动数智化部数据库研发中心OLTP数据库架构师,多年来深耕数据库领域,在政府,金融以及电信行业有着丰富的数据库管理经验,目前任职于中国移动集团数智化部,主要负责中国移动自研磐维数据库的推广应用。

16:00-16:45
  • 分布式数据库的架构与应用实践

    随着业务规模的不断增长和数据量的快速膨胀,传统的单体数据库已经无法满足企业对于高可用、高扩展和全球化部署的需求。分布式数据库应运而生,通过多节点协作,实现了数据的高效存储、弹性扩容和故障容忍,为互联网、金融、电商等行业的核心系统提供了坚实的数据基础。 本次演讲将系统梳理分布式数据库的发展背景、典型架构模型(如主从复制、分片、去中心化Paxos/Raft等)、数据一致性协议、容灾与自动恢复机制,并重点介绍三款具代表性的分布式数据库产品:YugabyteDB, Google Spanner, OceanBase. 同时会结合实际案例,分享分布式数据库在企业落地过程中的技术选型、性能优化与常见挑战。希望本次分享能够帮助大家深入理解分布式数据库的核心原理与主流产品实现方式,为数据库架构的设计提供参考。 主题章节: 1. 分布式数据库的基本概念与发展背景 2. 主流分布式数据库架构模型介绍 3. 三大代表性分布式数据库产品深度剖析 4. 企业落地实践与挑战

    • 赵飞祥
      Airwallex(空中云汇)
      DB架构师

      现为 Airwallex 资深DBA,网名 yumushui ,多年一线传统行业和互联网数据库架构设计与运维经验。Oracle 11g OCM,对MySQL、Oracle、PostgreSQL、Greenplum、MongoDB等多种数据库有丰富的架构、维护经验,乐于总结与分享,ITPUB博客专家,DTCC等数据库行业大会演讲嘉宾。

16:45-17:30
  • 智能体时代的数据库新机会?AI Agent 长期记忆后的存储需求

    2025 年被广泛视为 Agent 应用的元年,AI 技术正以前所未有的速度演进,催生出大量面向垂直场景的智能体产品。这些智能体正在从短时对话助手,演进为具备长期交互与自主决策能力的“数字分身”。然而,大模型本质上仍是无状态的,每次调用都依赖完整上下文输入,缺乏原生的长期记忆机制,制约了 Agent 的持续性与个性化发展。AI 记忆因此应运而生,成为构建 Agent 系统的关键基础能力,用于支持多轮交互、长期状态维护、个性建模与知识积累。本次演讲将介绍 AI 记忆的基本概念与主流实现方式,并分享我们在打造 Memobase 记忆系统过程中的架构设计经验与实践路径。演讲还将从数据库系统的视角出发,探讨智能体记忆对底层数据基础设施提出的新挑战与新机遇,涵盖云原生架构、多模态数据支持、弹性调度等关键技术方向。同时也将介绍 Memobase 在国产化版本中与云原生数据库 EloqData 的深度集成,作为两款开源产品,共同推动开源社区的发展。 分享大纲 1、什么AI Agent的长期记忆 2、Memobase简介 3、记忆系统对数据库的新需求 4、Memobase国产化商业版的数据库选型 5、未来的记忆系统需要的存储

    • 叶坚白
      Memobase
      创始人,奇绩创坛被投企业

      叶坚白,开源项目 Memobase,nano-graphrag作者,个人 solo项目 Github获 5000+ Star

专场6:数据库自主可控之路-(下)
13:45-14:35
  • 投资交易系统国产化改造架构实践和数据库适配

    当前,金融行业各类系统的国产化改造正如火如荼地进行。但对于国产化改造,大多金融系统面临着业务和开发人员短缺、系统适配、数据库选型,兼容性测试等挑战。本次分享将由平安资管资深架构师,带来一线实战经验。从架构视角,深入刮析系统国产化改造过程中的关键步骤,常见问题与避抗指南,自上而下的架构视角,过硬的技术平货,欢迎金融投资领域的同事们一起交流深讨。

    • 屠乐奇
      平安资产管理有限责任公司
      交易开发组组长,资深架构师

      屠乐奇,平安资管资深架构师,交易开发组组长,2023-2024年担任公司信创负责人,腾讯名人堂专家,上海区架构联盟理事,信创评审专家,上海资产管理协会AI+资管复合人才,中国资产管理协会示范组骨干,15年金融科技行业经验,曾任职于金融外企,金融创业公司,互联网金融公司,致力于积累金融行业经验,推广优秀的架构设计及框架落地。

14:35-15:25
  • 数据库架构方案选型思考与实践

    随着国产数据库在金融行业的深度应用,数据库在可用性、性能、安全等维度面临越来越多的挑战;华为GaussDB数据库解决方案以一套架构支持集中式与分布式两种部署形态,且都支持存算一体与存算分离的设计,以融合架构有效应对各行各业在数据库升级转型过程中的挑战。

    • 方博
      华为
      金融数据库解决方案总监

      专注于金融场景数据库解决方案的构建,先后完成银行、证券、保险等TOP行业的金融数据库解决方案架构设计。

15:25-16:15
  • PolarDB-X 场景化实践与技术创新

    PolarDB-X 是阿里云自研的自主可控集中分布式一体化关系型数据库。该topic将系统阐释,在国产化替代浪潮下PolarDB-X使用哪些独有技术,实现平稳替换,高效使用,简洁运维的技术宗旨。

    • 胡中泉
      阿里云
      数据库产品专家

      阿里云数据库产品专家,PolarDB分布式版产品负责人,十余年自研数据库工程技术经验,致力于自研分布式数据库在关键行业的推广和实践。

16:15-17:05
  • 某大型企业国产化替代和迁移经验分享

    某大型企业已大规模启动了国产化替代和迁移工程,现有系统基本运行在国外商业化产品平台,为降低国产化平台迁移难度和运行负载,该企业开展了在现有平台的大规模优化项目。本项目虽然基于现有平台展开,但运用到的优化技术等都适合于国产数据库,也是为国产化数据库提供运行性能指标基线、产品完善和优化实施经验借鉴。

    • 罗敏
      某大型企业
      数据库资深技术顾问

      罗敏老师系国内Oracle领域技术元老之一,从 1988 年 Oracle 5.1版到 2024 年 Oracle 23AI 的智能进化,他亲历了Oracle在国内各行各业的发展历程,也正在亲历信创和国产化转型过程。曾独创书籍《品悟性能优化》、《感悟Oracle核心技术》、《Oracle数据库技术服务案例精选》,即将出版《数据库启示录——一位IT老兵的130个从业奥义》

专场7:实时数仓与湖仓一体应用实践(上)
13:45-14:30
  • 流式湖仓架构优化与应用实践

    一、之家数仓架构演进 二、基于Apache Paimon的优化实践 三、应用案例: 1、数据加工链路优化 2、数据开发效率提升 3、查询加速实践 四、后续规划: 1、面向AI的新一代数据架构

    • 邸星星
      汽车之家
      计算平台负责人

      汽车之家计算平台负责人,10年大数据领域经验,目前主要负责建设流式湖仓、Data + AI 等产品。

14:30-15:15
  • 中国移动磐维OLAP数据库湖仓一体应用实践

    中国移动磐维OLAP数据库是中国移动数智化部整合中国移动大数据平台资源与人才优势,打造的一款“好用、易用、管用”的创新产品。具备完善的湖仓一体能力,实现数据仓库与数据湖的数据和模型互通,提升数据共享效率,解决数据孤岛问题,构建企业级湖仓一体融合分析大数据平台。

    • 王小玉
      中国移动数智化部数据库研发中心
      OLAP数据库架构师

      王小玉,中国移动数智化部数据库研发中心OLAP数据库架构师,磐维OLAP数据库产品负责人,负责公司OLAP数据库产品的研发和应用。有十数年的数据库内核研发经验,主要研发领域包括查询优化器、高性能计算、SQL on Hadoop等。

15:15-16:00
  • 小型金融机构数据湖建设思路

    在金融市场不断拓展与深化数字化转型的当下,小型金融机构正遭遇数据量的井喷式增长以及数据类型复杂多变等棘手难题。数据湖凭借其能够存储海量、多类型数据的架构优势,恰似一场及时雨,为小型金融机构破局数据困境提供了全新路径。它并非孤立存在,而是与小型金融机构业务需求深度交融。借助高效的数据查询、分析与挖掘功能,数据湖可全方位赋能机构在风险评估、客户画像、精准营销等关键业务领域,持续释放数据核心价值,为机构在激烈竞争中突围助力。 只是,小型金融机构在数据湖建设征程中,荆棘密布。云上部署与否,需谨慎权衡投入产出、数据管控及合规性;Hadoop 技术擅长海量数据分布式处理,适合资源有限且对成本敏感的场景,MPP 技术凭借高性能并行计算,更适配复杂数据分析与实时响应需求;入湖规则稍有不慎,会导致数据冗余混乱,数据生命周期管理失当,会使数据价值随时间流失;实时数据湖建设,对技术栈和数据一致性要求极高,是技术团队面临的严峻考验;运营成本居高不下,涵盖硬件投入、软件授权、运维人力等多方面,给小型金融机构带来沉重负担。然而,这条道路虽困难重重,但也机遇满满。各技术路线犹如八仙过海,各显神通,小型金融机构只要依据自身独特业务版图与技术家底,精研深思、综合评估,就能在这场数据湖建设挑战中,开辟出契合自身发展的特色之路,将数据资源转化为实实在在的竞争优势。 演讲内容重点提纲: 1. 数仓与数据湖的发展 2. 小型金融机构数据湖现状 3. 小型金融机构数据湖架构建设的关键技术 4. 未来规划与思考

    • 董占利
      海保人寿
      信息技术部公共软件室经理

      现任海保人寿信息技术部公共软件室经理,在保险行业深耕细作,积累了 14 年有余的丰富经验;近些年主要负责公司数据管理相关工作,包括数据治理、数据安全、数据技术工具建设等。

16:00-16:45
  • AI时代下的湖仓一体化平台建设的思考

    当前很多企业建设的大数据平台,已经成功解决了数据收集和存储的难题。然而,实际的应用场景,也对大数据平台提出了更高的要求,例如,如何快速落地,简单易用,如何彻底解决大数据的重复,以及大数据共享问题等。基于此,在本次本享中我们首先来看一下,传统的数据湖和数仓结合的挑战,给合 Databend 实际落地中遇到的问题,总结一下当前湖仓一体化平台建设的思考。然后,将深入介绍湖仓一体建设中面临问题的具体解决方法,例如,数据高效写入及数据去重 & 共享,理解流计算 & AI 和现代湖仓整合方案,以及多模态湖仓建设。通过这些问题及分析解决,来思考湖仓一体化平台建设及思考。

    • 吴炳锡
      Databend Labs
      联合创始人

      Databend 联合创始人,腾讯云 TVP,熟悉 MySQL 数据库及云上大数据解决方案。

16:45-17:30
  • 京东物流UData系统湖仓混合查询的优化实践

    京东物流UData作为赋能众多物流一线员工的一站式自助数据分析平台,完善了"找数-做数-用数"的闭环体系,通过在线报表和仪表板进行数据赋能,日均支撑百万级数据分析请求。其核心的湖仓混合查询引擎基于StarRocks深度开发和优化,成功解决了海量多源数据处理的行业难题。面对实时数仓、离线Hive/Hudi、OSS文件及多种外部数据源的异构环境,我们通过多个创新突破实现报表混合查询场景下的秒级响应,本次演讲我们将深入探讨UData查询引擎的核心技术和优化实践。

    • 刘敬斌
      京东物流
      大数据专家

      2017年加入京东物流,数据架构师,从事高并发系统的开发和数据平台的建设,目前负责京东物流UData数据分析平台查询引擎的建设工作,专注于通过OLAP引擎的全链路优化,提供高效的数据湖仓联邦查询体验。

专场8:Data+AI(上)
13:45-14:30
  • AI+Data数智平台在ebay的新实践

    随着AI大模型技术的广泛普及和应用,传统的数仓迎来了新的挑战:企业数据平台如何与AI更紧密结合并且赋能业务。ebay数据平台与AI平台在经过了一些列的探索和实践,总结出了如何构建AI+Data的数智平台来更快速赋能业务以及沉淀数据的智能知识的平台能力。 本场分享将通过分析ebay现有的业务和系统问题,基于data mesh,批流一体及AI agent/search等技术构建的开放知识/图谱平台,模块包含元数据管理,逻辑数据模型构建,知识生成流水线等等。同时针对系统构建过程中遇到的一系列架构以及部门职责问题,也会在分享中给出实践案例供架构师参考。

    • 朱冠胜
      eBay
      资深技术经理

      复旦大学计算机硕士学位,拥有十余年机器学习工具平台的研发经验,风控领域专家。硕士毕业就职于PayPal风控部门成长为资深架构师,负责风控模型相关的开发工具以及ML平台研发和架构。目前任职于eBay AI平台资深架构师,负责变量平台(feature store)、模型训练平台、模型推理平台的架构和核心组件研发, 近期关注在LLM/GenAI相关的平台功能建设,包括异构训练集群整合,AI监管,向量数据库以及大规模AI解决方案等支持。非常荣幸能与大家交流向量数据库的研发,运维以及LLM生态的经验。

14:30-15:15
  • Lindorm多模数据库Data+AI解决方案和落地实践

    Lindorm云原生多模数据库自研多模态大宽表,支持正排、倒排、向量融合查询,内置AI推理算子,在Agent长期记忆、AI搜索、多模态数据检索等方向都有成熟解决方案。本议题将介绍Lindorm实践落地方案,如何满足用户AI场景的数据管理需求。

    • 肖冰
      阿里云
      数据库产品专家

      阿里云数据库产品专家,NoSQL AI产品负责人,十余年多模数据库工程方案实践经验,致力于多模数据库在AI领域的推广和实践。

15:15-16:00
  • 腾讯云TDSQL打造多模态数据分析底座

    AI多模态分析能力大幅拓展了数据分析的边界,使得用户在结构化库表数据、文本、图像、语音等多模态异构数据间进行联合分析,挖掘出业务更大价值。 TDSQL经过多年金融等重点行业打磨,已形成完整的企业级数据底座能力。本次分享将介绍产品在Data + AI方向的创新探索,如何结合AI大模型能力进行多模态数据的统一分析。

    • 伍鑫
      腾讯云
      数据库研发总监

      伍鑫,腾讯云数据库专家,在数据库、数据复制、大数据计算等领域有丰富经验,曾发表多篇相关论文、专利。加入腾讯前曾在IBM大数据分析团队工作多年。加入腾讯后,负责TDSQL-PG数据库研发工作,对优化器、并行计算、向量化执行等方向有深入研究。

16:00-16:45
  • OceanBase:面向未来的 AI 数据智能平台

    待更新

    • 戴涛
      OceanBase
      公有云事业部解决方案总监

      戴涛先生现任 OceanBase 创新和AI业务负责人。他之前在IBM、阿里云和TiDB工作。在IBM期间,担任咨询部云计算首席架构师,主导多个大型分布式核心系统的设计和实施。在阿里云担任新零售解决方案总经理和行业总经理,推动中国泛零售行业上云和数字化升级。他是The Open Group 认证Thought Leader Architect。

16:45-17:30
  • 基于大模型的chatBI设计实践

    本次分享将深入探讨我们以大模型为基座的创新数据分析产品—ChatBI。我们将聚焦于其核心技术创新:一个多Agent协同的工作流。该架构能将复杂分析任务拆解,交由意图识别、SQL生成、验证与归因等专用Agent异步处理。为提升准确性,我们应用langGraph等图技术来理解复杂的语言关系 ,并结合RAG技术、大模型与包含多重验证流程的Prompt工程 ,深度优化SQL生成。我们将详细解析如何通过这一系列深度技术,实现精准、高效、可解释的数据洞察。

    • 刘尉良
      福佑卡车
      大数据算法负责人

      曾任玖富集团大数据中心总经理,负责集团整体大数据产品,数据分析,技术算法团队。 之前也任职过去哪儿网,寺库网,当当网等互联网公司,负责事业部或者公司级大数据智能部门,负责大数据基础平台,数据仓库,BI,智能运营平台,个性化推荐,智能定价,风控等平台系统搭建落地。

专场9:AI For DB(下)
13:45-14:30
  • AI重塑数据库:达梦的智能化探索与实践

    以国产数据库在AI浪潮下的战略定位出发,以人工智能与数据库双向赋能为主旨,重点介绍达梦在AI+数据库领域的创新实践和成果,并结合行业和技术发展趋势,对AI信创生态建设和后续探索方向进行规划和展望。

    • 李庄庄
      武汉达梦数据库股份有限公司
      达梦子公司达梦技术副总经理

      李庄庄,男,高级工程师,现任武汉达梦数据技术有限公司副总经理,分管云计算、大数据及人工智能系列产品研发及推广落地工作。个人曾获得省级科技进步奖、“楚天英才计划”科技创新团队、“武汉英才”等荣誉,主持并参与了多个部、省、市级科研课题项目。

14:30-15:15
  • 腾讯云TDAI:用AI治理好数据库,让AI用好数据

    腾讯云数据库AI服务TDAI全新发布,构建AI原生的数据库智能中枢。TDAI以场景化智能体为核心。数据库治理智能体将DBA经验转化为结果交付的智能体,引领数据库运维效能跃迁;数据洞察智能体让人与数据直接对话,重塑企业数据决策的价值链路;智能体基础设施层(Agent Infra)融合数据库大模型、全域上下文引擎与智能体工具集,奠定下一代面向智能体应用的数据基础设施的基座,开启数据库智能化代际跃迁。

    • 余欣纬
      腾讯云
      数据库产品专家

      余欣纬,腾讯云数据库产品专家,从事数据库领域相关研发/产品工作8年,在多个国内头部公司担任数据库领域的核心研发/产品工作,在数据传输、AI for DB等方向具有丰富经验。现负责腾讯云数据库AI服务产品工作,持续夯实面向智能体的上下文底座,为客户提供场景化交付结果的数据库智能体。

15:15-16:00
  • 从可视化到智能化:DBA助手让数据库运维效率跃升300%

    数据库运维覆盖多引擎、多场景,涉及高可用性、性能优化、数据安全、自动化运维等核心领域,面临着统一管理、故障快速定位、智能化诊断、大规模监控等业务挑战,华为云数据管理服务DAS整合AI算法和深度学习技术上线智能DBA助手,支持MySQL、PG、SQLServer等10+引擎,提供实例诊断、异常快照、慢SQL分析、自治限流等能力,支持常见故障与隐患检测、故障根因定位、过载恢复,较DBA传统定位效率提升300%

    • 崔凤明
      华为云
      数据库智能运维技术专家

      具有10年数据库管理&智能运维工具研发经验,对数据库高可用性、性能优化、数据安全、自动化运维等领域有丰富技术实践,现担任华为云数据管理服务DAS系统架构师,推动数据库运维从可视化向智能化演进。

16:00-16:45
  • 大模型赋能保险智能应用运维实践

    为应对保险公司线上投保的全天候及非工作日活跃特点,以及客户随时可能遇到的投保问题,通过24小时机器人值守,借助大模型及问题分析树,实现快速响应与问题解决。 本次分享,涵盖问题精准识别、问题决策树精准定位、极速检索与精准匹配、问题应急高效处置等方面。其目的在于借助大模型的智能诊断能力,大幅缩短故障排查时间,同时减少人工干预,降低运维成本。 演讲内容重点提纲: 1. 问题精准识别 当客户在微信群留言沟通时,大模型AI客服首先会进行智能识别,依据问题的关键词、语义和语境等信息,精准提取客户问题。 2. 问题决策树精准定位 依循投保交易流程精心构筑的问题决策树,全面覆盖客户咨询、信息提交至保费支付的投保全流程。凭借其强大的问题溯源能力,无论是系统接口故障、数据传输失误,抑或是客户操作难题,皆可借助决策树迅速锁定问题核心,精准探寻解决方案。 3. 极速检索与精准匹配 在精准锚定问题后,大模型AI凭借其卓越的语义解析与深度检索能力,于知识库中快速检索相关信息,并与客户问题进行智能匹配。 4.问题应急高效处置 当系统异常状况被精准捕捉时,依托大模型先进的语义解析与深度知识检索技术,以毫秒级速度精准锁定问题特征,并从应急预案知识库中调取适配方案。随后,将解决方案即时推送至运维团队微信,确保问题在最短时间内得到妥善处理,全方位保障系统稳定运行,为业务连续性提供坚实支撑。

    • 康守兵
      海保人寿
      信息技术部应用运维室经理

      现任海保人寿信息技术部应用运维室经理,深耕保险行业20余年,曾参与十多家保险公司核心业务系统的建设和运维工作,积累了丰富的保险业务及IT经验。近年来,主要负责公司应用运维相关工作,涵盖应用运维系统建设、生产问题定位分析处理以及保障系统高可用性等方面。

16:45-17:30
  • AI 驱动数据库智能化:从技术路径到智能体生态构建

    在 AI 技术加速渗透的当下,数据库正从传统的数据存储与管理工具,向具备自主决策能力的智能引擎演进。本次演讲聚焦 AI 如何重构数据库能力边界,围绕自然语言交互、智能调优、向量检索、自愈运维等核心场景,深入解析人工智能如何重塑数据库的查询效率、运维模式与分析能力,系统梳理当前数据库智能体的主流技术路径及落地实践。无论你是技术决策者还是一线开发者,都能通过真实场景案例与跨方案对比,明晰不同智能体技术的适配场景与选型逻辑,把握数据库智能化的发展脉络。

    • 皮光明
      北京皮皮家科技有限公司
      创始人

      深耕互联网行业18年,曾任CTO/首席架构师。作为国内首批ChatGPT、DeepSeek深度应用实践者,长期聚焦全球AI前沿技术落地,主导多领域技术融合与行业革新。历任资深产品经理、首席架构师及CTO,主导高并发金融系统与AI中台架构设计,保障亿级用户平台稳定运行;以“技术+场景”驱动产业升级,融合AI大模型与行业痛点,为企业提供从架构设计到生态落地的全周期解决方案,助力智能化转型与创新价值增长。曾于滴滴、京东等头部企业推动核心业务变革,在IBM担任架构师期间深度应用Watson AI技术构建企业级智能解决方案,并完成金风科技“能源+互联网”数字化转型;跨领域覆盖云计算、AI、机器人等行业,从程序员到管理者实现全链路跨越,带领团队交付30余项复杂项目,为上百家银行及政府机构提供云计算定制化方案,客户满意度超95%;以用户需求为核心打造多款高竞争力产品,同步创立AI技术自媒体,输出前沿技术洞察,赋能开发者生态建设。

专场10:多云与云原生数据库开发与实践
09:00-09:40
  • 中国银联数据库容器化和智能化探索与实践

    在金融科技浪潮下,中国银联积极投身于数据库领域的创新变革,全力开展容器化和智能化的探索与实践。容器化技术的引入,让银联突破传统数据库架构局限,实现了资源的灵活调配与高效利用,以更敏捷的部署与扩缩容机制,从容应对业务高峰低谷。而智能化征程中,借助大模型、机器学习等前沿技术,银联搭建起智能运维体系,构建多个智能化智能运维场景,对数据库运行实时洞察,提前预警潜在风险,并实现自动化修复,显著提升运维效率、保障数据安全。本主题将深入剖析在金融科技浪潮下,中国银联在数据库容器化和智能化方面的探索,分享宝贵经验,为整个行业数据库技术革新提供借鉴思路。 分享大纲: 1、背景与挑战 2、数据库容器化 3、数据库管理智能化

    • 梁克会
      中国银联
      高级工程师、数据库专家

      待更新

09:40-10:20
  • 云智融合:Serverless智能弹性与AI优化驱动的云原生数据库平台

    云原生数据库正经历智能化变革。通过 Serverless智能弹性架构 ,实现计算/内存/存储资源独立伸缩,支持超大规模资源亚秒级弹升。AI深度赋能使数据库交互范式重构 ,通过智能优化器加速SQL执行效率,全面提高云原生数据库数据处理能力。云原生数据库将朝着 智能化内核 、 无感化弹性 持续演进,让数据库从“工具”进化为“AI驱动的业务伙伴”。

    • 刘迪
      腾讯云
      数据库产品总监

      腾讯云数据库产品总监,网名迪B哥,中国计算机行业协会开源数据库专业委员会副会长、北京航空航天大学特聘讲师。拥有视频、游戏、金融、电商等行业的多年数据库架构设计和优化分析经验,曾担任腾讯视频、腾讯新闻、腾讯体育等业务的数据库管理和运维负责人,对外推出了《迪B课堂》、《我说》等一系列数据库实战课程。加入腾讯云后,主导了腾讯云数据库MySQL的企业化转型,云原生数据库TDSQL-C的孵化以及AI与数据库自治等核心项目。

10:20-11:00
  • 金融级多中心容灾架构研究和实践

    对于传统金融级多中心容灾架构切换效率低、数据一致性难保障等痛点,本方案研究金融级多中心数据库高可用容灾架构方案,结合应用层智能热切两个方面,实现多中心全链路自动化故障转移。将金融核心交易系统灾备切换RTO时间缩短至1-2分钟,为金融级核心交易、智能投顾等多中心高可用架构应用场景提供解决方案。

    • 王宇坤
      中国邮政储蓄银行
      高级工程师

      具有多年数据库及云原生领域的运维背景, 精通主流数据库架构设计与内核原理。参与多个数据库和云原生技术应用方向的课题研究与项目落地,在金融系统多中心容灾架构设计与技术创新方面具备丰富实践经验。

11:00-11:40
  • AI 时代的分布式事务:Seata Saga 模式的实践与展望

    内容聚焦于分布式事务框架 Seata 的架构设计、Saga 模式的应用实践,并进一步探讨了 AI 技术如何赋能事务编排。在 AI 驱动业务复杂化的趋势下,传统的事务模型面临挑战,Seata 借助状态机设计与 AI Agent,正在积极构建更加智能和自动化的事务处理方案。

    • 赵新
      dubbogo
      社区负责人

      待更新

11:40-12:20
  • 如何在K8s上构建大规模的DBaaS(Database as a Service)平台

    在云原生技术飞速发展的今天,如何在 Kubernetes 上构建一个大规模的 DBaaS(Database as a Service)平台,已经成为技术创新的核心挑战之一。而 KubeBlocks,作为一款开源工具,为这一目标提供了极具吸引力的解决方案。它通过标准化的数据库定义模板和自动化的运维能力,让在K8s上集成一款数据库像搭建乐高积木一样简单灵活。KubeBlocks 支持 MySQL、PostgreSQL、Redis 等40多种数据库,能够在 Kubernetes 集群中实现快速部署、弹性扩展和高可用管理,确保数据的可靠性和一致性。此外,它还提供多租户隔离支持,结合统一的 API 接口,帮助企业构建安全、高效的云原生数据库服务平台。可以说,KubeBlocks 将传统复杂的数据库运维转化为一种标准的、可操作性的工程实践,为大规模 DBaaS 平台的构建提供了强大的工具与坚实的基础。 分享大纲: 1. 背景和挑战 2. KubeBlocks介绍 3. Multi-K8s HA和Muli-K8s DR 4. 面向多租户的DBaaS 5. DBaaS与DevOps 6. DBaaS与边缘计算 7. 展望:AI DBaaS

    • 曹伟
      杭州云猿生数据库有限公司
      创始人兼CEO

      曹伟,杭州云猿生数据库有限公司创始人兼CEO。前阿里云数据库总经理/研究员,云原生数据库PolarDB发起人。中国计算机学会数据库专委会执行专委、开源专委会执行专委,获得2020年中国电子学会科技进步一等奖,在SIGMOD、VLDB、ICDE、FAST、USENIX ATC等数据库与存储国际顶级学术会议发表论文20余篇。

专场11:数据要素与数据资产管理
09:00-09:50
  • AI时代下的数据要素管理思考

    数据要素的核心特征在于成为新兴的生产要素,在大模型时代,数据要素该如何描述,以便能让IT系统和大模型能更有效率的处理和消费数据呢? 企业数据的处理和消费环节,长期以来都是IT角色即数据工程师来处理。业务只负责提出简洁甚至简单化的需求描述,剩下的就交给数据工程师不断去打磨验证,再回头和业务迭代确认。在这个过程中,数据业务的大量语义知识都在人脑中。在数据智能化时代,我们都期望系统和大模型能够更多地取代数据工程师来处理和消费数据,现有的数据资产目录和数据字典类表达是不够用的,本文将局部讨论怎样的数据要素管理和语义表达才能更好地支撑这个变革。

    • 汪松良
      某头部资管公司
      数据部总监

      汪松良,CCF会员、港中文(深圳)数据科学项目业界导师。现在资管公司负责企业数据建设管理,聚焦于面向大资管业务的数据架构、数据模型及数据治理等工作。对数据管理、数据架构、数据语义表达、数据自服务等有深入独立思考,并有多项发明专利。

09:50-10:40
  • 超大型价值导向精益数据治理案例分享

    某超大型跨国制造业企业,利用精益数据方法,构建数据智能飞轮,打造企业数据价值体系。本分享将分享一个历时三年持续围绕精益数据方法论构建的数据、AI 应用牵引的数据治理体系,从场景到工具的全链路建设案例,分享精益+数据的价值创造体系落地之旅。

    • 史凯
      某超大型跨国制造业企业
      数研智算总经理/精益数据创始人

      20年以上企业信息化架构,数字化转型咨询与实施经验,原阿里云智能中国区咨询总经理,曾经从业于IBM,埃森哲、EMC、ThoughtWorks,凯捷咨询,曾任埃森哲资深咨询经理,EMC中国区咨询总监,ThoughtWorks数据智能总经理。原创出版《精益数据方法论》《数据要素价值化蓝图》

10:40-11:30
  • 数据资产评估模型与数据资产入表

    当数据挣脱“信息”的桎梏,蜕变为可评估、可登记、可量化的核心资产。我们以标准化评估模型为尺,丈量数据的真实价值;用ERP系统的资产管理模块为基,筑牢资产化的坚实根基。从数据到资产的跨越,从系统登记到财务报表的合规呈现,每一步都是企业数字化转型的关键跃迁。这不仅是数据价值的觉醒,更是企业资产版图的全新拓展。让数据在财务报表上清晰列示,让无形价值转化为有形增长,我们正开启资产定义的新时代——数据资产,驱动未来的核心引擎。 现任深造通创始合伙人,制造业,咨询业,互联网业阅历丰富。

    • 喻继鹏
      深造通
      CIO

      现任深造通创始合伙人,制造业,咨询业,互联网业阅历丰富。

专场12:数据工具创新
09:00-09:50
  • 金融支付系统数据同步实践和演进:中国银联新一代数据分发产品DTEX

    在数智化与业技深度融合的当下,金融支付系统对“如何确保系统稳定运行、分发、同步并保障数据一致性”提出了更高要求。特别是金融大型分布式多中心架构、数据驱动应用场景的快速发展,让数据转移、同步技术不再局限于辅助工具,而正逐步成为企业数据体系的核心支撑能力。本分享旨在梳理中国银联数据同步产品的演化路径与落地实践,介绍其新一代数据分发产品DTEX建设成果,探讨如何通过架构优化与平台化能力,提升数据同步产品对金融支付业务的保障和支撑作用。

    • 赵根苗
      中国银联
      高级工程师、资深架构师

      中国银联高级工程师,负责核心交易转接系统和公共应用组件研发。计算机硕士,PMP认证会员,长期专注大型分布式联机系统及公共应用组件领域研究。其带领的项目和课题曾获中国人民银行科技发展奖二等奖两项、三等奖1项;银联系统优秀科技成果一等奖1项、二等奖1项;申请发明专利6项,已授权专利2项。

09:50-10:40
  • 天翼云(DTS)数据传输服务的同异构数据同步实践与AI时代探索

    数据传输服务(DTS)是一款专业、高效的数据迁移与同步解决方案,支持同构及异构数据库之间的结构转换、全量迁移与增量同步。服务具备断点续传、冲突检测、数据校验等高级功能,可灵活部署于公有云、混合云及私有化环境,全面满足企业跨平台、跨地域、跨版本的数据流动需求。 在性能方面,DTS在全量迁移场景下可实现近100MB/s的传输速率,增量同步延迟通常控制在秒级,保障数据的实时性与一致性。目前DTS已全面支持主流数据库引擎,包括 MySQL、Oracle、SQL Server、PostgreSQL 等,同时兼容天翼云自研数据库 TeleDB、UDAL 等单机及分布式数据库系统,广泛应用于数据库上云、容灾备份、多活架构和实时数据分析等关键场景。 依托零停机迁移技术,DTS可有效保障业务连续性,并提供可视化监控与自动化运维能力,显著降低数据迁移过程中的成本与风险。在“云改数转、智惠发展”的战略背景下,DTS持续助力企业数字化转型,并积极拥抱AI时代,在数据准备、智能诊断、MCP Server 集成等多个方向展开探索与实践。 本次演讲将重点介绍 DTS 的整体架构设计,以及迁移评估、全量迁移、增量同步等核心能力的建设思路与技术实现。

    • 沈春
      天翼云科技有限公司
      数据迁移服务团队负责人

      拥有14年软件研发经验,曾先后就职于携程、饿了么和阿里云,具备丰富的业务系统与大数据平台研发背景。近十年来,专注于数据同步中间件的研发工作。 在饿了么期间,主导数据复制中间件(DRC)的设计与开发,成功支撑了公司全站异地多活架构的落地实施。在阿里云期间,主要负责阿里云DTS(数据传输服务)的核心设计与开发,主导完成了DTS管控平台的整体重构(A2A架构升级),并推动建设了DTS的ETL能力、数据稽查、数据入湖入仓等功能模块,持续提升产品的稳定性与功能丰富度。

10:40-11:30
  • PDManer数据建模工具在异构数据统一管理中的实践

    数字化时代,企业IT系统规模和复杂度不断增长,多业务系统数据管理难题日益凸显。不同业务系统采用不同数据库平台、各方自成体系的建模规范、分散孤立的数据字典管理,造成数据架构碎片化,数据标准难统一,系统间交换复杂度急剧上升。 本次分享将深入探讨数据建模工具PDManer在企业级异构数据统一管理中的实践经验。PDManer通过标准化数据建模、高效贯彻数据标准要求、广泛数据库支持、大规模团队协作技术支撑,以及版本与业务同步进化的持续管理,构建了从需求分析到数据库落实的完整解决方案。 PDManer引入AI能力,将业务需求高效翻译为流程模型和数据模型等;通过思维导图梳理、流程建模与数据三层建模高效整合,一体化精准落实业务需求;提供逆向解析数据库的模型盘点能力,兼容其他工具平台文件格式;同时通过MCP-Server服务和API接口支持生态打通,将数据模型资产作为AI引擎基础数据服务,为智能开发工具提供规范代码生成基础,为低代码平台提供标准化数据结构定义和字段映射关系,显著降低开发配置复杂度并提升应用构建准确性,构建完整的智能化数据建模生态。 分享大纲: 1. 企业异构数据管理案例及痛点剖析 2. PDManer数据建模工具如何解题 3. AI增强的一体化智能建模 4. MCP-Server服务与开发生态赋能 5. 实践案例与效果展示 分享要点: 1. 企业面临数据库平台多样化(MySQL、Oracle、PostgreSQL、国产信创数据库等)、各部门各团队建模规范不统一(命名规则、字段定义各异)、数据字典分散管理导致系统间数据交换成本高昂的各种案例集锦 2. PDManer数据建模通过集中统一的企业级数据建模工具、实现标准化规范化、自动化检查验证、实现数据库任意切换、多人协同编辑冲突解决、模型多版本与业务需求变更同步等核心能力 3. 从现有数据库逆向提取并进行模型盘点梳理,支持PowerDesigner、EXCEL等文件格式导入导出,提供标准API接口实现与第三方系统集成 4. AI将自然语言业务需求自动转换为技术模型,整合思维导图业务梳理+流程建模+概念逻辑物理三层数据建模,在同一平台完成从需求到实现的全流程设计 5. MCP-Server将企业数据模型转化为结构化API服务供AI系统调用,为代码生成工具提供标准化模板,为低代码平台提供预定义数据结构和字段关系减少手工配置 6. PDManer从开源到商业成长经历分享以及如何平衡开源和商业

    • 杨松
      扬数起元数据科技(苏州)有限公司
      总经理

      杨松,扬数起元数据科技(苏州)有限公司创始人兼总经理,拥有超过17年的数据管理和金融IT领域从业经验。 曾在金融IT公司深耕超十年,专注信用风险产品研发,多次成功主导大型金融机构核心业务系统研发。后续在金融机构担任科技部总监,负责软件研发与技术架构规划。随后作为央企华东区域项目交付负责人。多重职业履历使其能够从技术开发、团队管理、甲乙方交付等多维度全面理解系统架构与数据治理的复杂性。 作为开源技术坚定践行者,于2018年开源了数据建模工具PDMan(PDManer前身),该工具历经7年持续迭代优化,目前已服务超过百万开发者,项目在Gitee获得10.4K个star,在国内数据库工具领域具有重要影响力,构建了活跃的社区生态。基于对数据建模工具的深度理解和丰富的社区运营经验,创立扬数起元公司,专注数据领域,为数据管理、开发及应用提供基础工具产品,致力于将开源技术与商业实践相结合,持续推动数据基础工具创新发展。

11:30-12:20
  • Postgres优化器:利用物化视图进行自动查询改写

    物化视图在复杂查询中有着广泛的应用,其数据可看作是预先计算并存储的查询结果集,能够显著提升复杂分析查询的性能,特别是针对大数据表的聚合查询。 在OLAP数据库中,复杂查询通常包含海量的数据扫描,以及复杂的计算。如果数据库内核能够自动的识别用户的查询SQL,与相应物化视图进行匹配,就可以将用户的复杂耗时查询,改写为基于物化视图上的查询,直接返回结果,极大的提高效率。 要实现这一优势,关键在于查询优化器必须能够智能地识别何时可以利用物化视图进行查询改写。本次演讲着重阐述在Apache Cloudberry(基于Postgres优化器)中,如何利用物化视图进行查询改写,包括:物化视图的有效性维护,视图匹配算法,改写查询表达式,聚集计算及Group By处理等。 其基于代价的优化机制会生成多种可能的改写方案,最终选择最优执行路径。物化视图可作为整体,或者查询中的一部分替换,不仅能处理基础查询,还能有效应对包含选择、连接和子查询等。

    • 张明礼
      北京酷克数据科技有限公司
      资深数据库内核专家

      清华大学毕业,2024年荣膺PostgreSQL社区""Postgres Contributor""称号。并被中国开源软件联盟Postgres分会授予""PostgreSQL ACE""称号。作为Apache Cloudberry项目核心贡献者,主导了包括优化器、执行器、分布式事务、存储系统等核心模块的架构设计与开发工作,是并行化查询、物化视图查询改写等创新特性的主要实现者。 曾任职于Greenplum核心开发团队,在PostgreSQL及Greenplum开源社区中贡献了多项重要特性开发与关键问题修复,持续为开源数据库生态系统的发展贡献力量。

专场13:向量数据库与RAG检索技术实践
09:00-09:40
  • 大模型时代的多模态AI数据库探索

    我们正站在人工智能的拐点—文本、图像、声音、视频等异构数据的交织,使传统数据库面临前所未有的挑战:如何高效存储海量非结构化数据?如何实现跨模态内容的深度关联与语义理解?又如何支撑大模型对复杂信息的实时检索与推理?本次演讲将聚焦多模态AI数据库的前沿探索。我们将解析在大模型应用的需求下,数据库如何突破单一模态的局限,优化多模态数据的存储、检索与治理效率,解决数据“存得下、找得准、用得活”的核心命题,为AI应用提供高质量的知识。与此同时,我们还将进一步分析数据库如何同当前的AI模型进行融合,将大模型应用交由SQL表达,大幅降低大模型应用的部署复杂度。

    • 魏星
      中兴通讯
      EBASE AI数据库项目经理

      现任中兴通讯向量数据库团队技术负责人,技术预研经理。2021年博士毕业于华东师范大学,研究方向为向量数据库、分布式数据库系统、异构数据库系统,在CCF-A/B类会议和期刊上发表数十篇论文。

09:40-10:20
  • 当RAG席卷千行百业:GaussDB如何构建企业级知识检索底座

    随着大模型成本不断下探,以RAG为代表的AI应用正在席卷各行各业,并不断地向垂直行业深入,向量数据库作为知识存储和检索系统,需要不断演进来适应越来越复杂的任务。本议题将重点介绍GaussDB向量数据库在高性能、大容量、高精度等企业级能力维度上的设计和思考。

    • 朱金伟
      华为
      数据库高级技术专家

      从事数据库研发工作10余年,当前负责向量数据库技术演进以及Data+AI领域的创新工作。

10:20-11:00
  • 腾讯云向量数据库助力客户各类AI场景发展中的挑战和演进

    AI领域的快速发展驱动了各个领域的技术变革,向量数据库在这个过程中充当着重要的数据存储和计算的角色,在过去的一年中,腾讯云向量数据库助力了各行各业的客户业务成功,在百亿级向量规模、10w+单表QPS、高稳定性服务等方面取得诸多成果。本议题分享在这个过程中腾讯云向量数据库团队所遇到了诸多的场景和挑战,从而在特性、工程技术、算法、运维管理等方面的诸多演进,以及未来可能继续演进的方向,以更好地去支持AI时代客户的业务成功变革。

    • 谢宇
      腾讯云
      向量数据库技术负责人

      谢宇,腾讯云向量数据库技术负责人,从事数据库领域相关开发10+年,曾在多个国内头部公司担任数据库领域的核心研发工作,对于传统数据库、NoSQL有深刻的理解。现就职于腾讯云,负责腾讯向量数据库的技术发展演进,持续夯实向量数据库的内核和管控基建,为客户提供更丰富的特性和更稳的AI基础设施。

11:00-11:40
  • Data + AI时代下的数据处理分析架构与技术演进

    本议题将介绍结构化数据与非结构化数据的处理分析架构、技术与业务演进,以及阿里云云原生数据仓库AnalyticDB for PostgreSQL在该业务场景下提供的Data+AI能力,包括数据分析、向量检索与RAG、以及In-DB AI等。 在向量检索与RAG业务场景进行深度技术解析,最后是业务场景案例分享。

    • 印才华
      阿里云
      数据库资深技术专家

      阿里云数据库资深技术专家,云原生数据仓库AnalyticDB for PostgreSQL内核研发负责人。

11:40-12:20
  • 基于Oracle 23ai的RAG实践

    Oracle 23ai引入了向量存储与向量搜索能力,并支持通过库内外模型将数据向量化能力,使用APEX还可以库内直接调用大模型。结合私有数据与7B级模型进行RAG实战演示。

    • 尹海文
      Oracle
      ACE

      公众号“胖头鱼的鱼缸”作者,Oracle ACE,拥有OCM 11g、12c、19c,MySQL 8.0 OCP,精通Oracle数据库及Oracle Exadata一体机运维,在Oracle数据库方面有较为深入的建树,熟悉Oracle数据库最新技术发展。熟悉开源数据库如MySQL、PostgreSQL、Redis、MongoDB、ElasticSearch等。目前主要服务于四川移动O域,负责数据库维护一线技术支持与二线技术支撑。

专场14:实时数仓与湖仓一体应用实践(下)
13:45-14:35
  • Flavius:原生图数据湖仓的架构设计与落地实践

    现有图数据库大多专注于 OLTP 事务处理,在面对如金融反欺诈中的图洞察、游戏社交中的子图演化分析、AI 场景中的语义上下文构建等 OLAP 型任务时,存在性能瓶颈、存储成本高、系统不统一等问题。为此,我们设计并实现了 Flavius——业内首个基于湖仓一体架构打造的原生图 OLAP 数据仓库。 Flavius 采用计算存储分离架构,支持列式存储、向量化执行、Time Travel、多租户资源隔离,底层基于开放格式(如 Parquet)构建,配合 MOR/COW 增量机制实现高效数据导入导出,天然兼容现有大数据生态,简化了图数据流转链路。存储引擎支持十亿级节点、百亿级边的子图分析任务,结合图索引与查询优化器,显著提升深度遍历与图匹配效率。 此外,Flavius 针对 GraphRAG 场景,原生集成自研图增强语义检索算法,显著提升了大语言模型对企业知识图谱的检索覆盖率和推理能力。我们将在本次演讲中系统介绍 Flavius 的设计动因与技术实现,包括在反欺诈、RAG 检索、社交网络结构分析等场景下的落地实践,展示如何在真实业务中打通“图存储—图分析—图AI”的湖仓闭环,释放图数据的结构价值与AI价值。

    • 张玉杰
      Kasma
      图数据库内核研发工程师

      张玉杰,Kasma 图数据库内核工程师,7年OLAP内核研发经验,专注分布式执行引擎、列式存储与查询优化,曾主导某开源时序查询引擎研发,活跃于 Apache Iceberg、DataFusion、Velox 等开源社区。

14:35-15:25
  • 实时数仓与AI:从大数据到数据库

    当下实时数仓和AI是比较火热的话题。最终这些是要解决实际问题的。理想与现实是有差距的。结合实际来看如何运用解决实际问题,并且给出DBA如何与AI相互协作的思考。

    • 薛晓刚
      Oracle
      ACE

      工学学士,工程硕士。从业20余年,设计、实施和运维高并发的数据架构。曾服务于政府、公安、交通、安防行业,从事过大型项目管理,单机处理超过100亿量级的数据库。目前任宝武集团/欧冶云商股份有限公司数据库首席,从事产业互联网,负责高可用、业务连续性和高并发数据架构设计和运维管理。获得的荣誉有:Oracle ACE-Pro ,Oracle讲师,MySQL讲师,PostgreSQL ACE Partner,阿里云 MVP、TiDB MVA、TiDB布道师,布道师组委会委员,OceanBase 数据库观察团团长、HaloDB外聘技术顾问、ITPUB论坛内存数据库版主、核心专家、金牌顾问、ITPUB培训专家百人团、收录国内数据库风云百人团,机械工业出版社专家委员会委员,工信部下属信通院创新实验室成员。工信部下属开放原子基金会工委会委员。

15:25-16:15
  • 高途实时数仓演进

    高途教育实时数仓历经多阶段迭代,本场将聚焦教育场景下实时数仓的演进路径,解析行课数据实时同步、续班交易链路优化等核心实践,分享业务需求驱动下技术架构的升级逻辑,为教育行业实时数据体系建设提供可复用经验。

    • 杨宇星
      高途
      数据开发

      杨宇星,高途教育大数据技术专家,7年大数据领域实战经验,主导公司行课、续班、交易的实时与离线链路开发维护,同时负责高中业务线所有数据内容,擅长将教育业务场景与数据技术深度融合,通过技术赋能与团队协同创造显著业务价值,让数据链路与业务增长实现深度绑定。

16:15-17:05
  • 流批一体在京东广告的应用

    在广告技术领域,模型特征的质量与时效性正成为制约算法效果的隐形瓶颈——实时特征与离线特征口径割裂,导致线上预估偏差;流批两套代码重复开发,数据团队疲于维护;时下,湖技术及流批一体的计算作为大数据领域的热门方向,逐渐在各大互联网公司实践与落地。模型的训练和推理作为数据计算的重要场景之一,广泛使用流式数据和批式数据,其时效性、迭代效率、数据质量将直接影响广告收入。本篇将介绍在京东广告特征计算场景在流批一体场景的探索与实践,介绍过程中面临的挑战与机遇。具体包括如何用关系范式对复合结构进行抽象?如何用关系范式表达复杂计算?如何做复用性更强的流批一体的计算?探讨: a)存储的流批一体 b)计算的流批一体(待进一步完善) 分享要点:Iceberg、Hudi和Paimon等湖技术的应用、Flink SQL批场景的应用

    • 刘军
      京东零售
      大数据技术专家

      刘军,京东零售副总监级技术专家。具备9年大数据及计算广告领域从业经验,曾出版多篇专利。负责广告计费、统计系统和广告数仓建设等,对大数据的端到端一致性有深入研究。现负责广告特征数据计算。

专场15:DataOPS
13:45-14:35
  • 利用好Agent,DataOps也可以平民化

    DataOps(数据运营)目的是从大数据中获取业务价值,四个关键构成,数据工程,数据集成,数据安全和数据质量。配置、血缘、管理、治理、可用性,一直是制约DataOps发展的几个实践难点。基于大模型提供的基础能力,以及Agent技术体系的逐渐成熟,场景化Agent配合专家型Workflow,推动DataOps从产品应用,进化到了智能体系。

    • 王浩
      某知名大型互联网公司
      大数据平台应用技术负责人

      已从业15年,一直从事数据仓库、大数据技术、算法工程等技术工作。先后在美团、趣店、TCL云平台、字节跳动等企业任职。熟悉主流的大数据、数据湖等计算引擎,并对数据仓库理论、元数据管理体系有深入了解;2024年开始,工作重点主要是基于大模型体系的Agent平台建设与应用搭建。 先后负责过,从0搭建离线&实时混合型大数据平台,数据平台元数据管理体系,AI应用商业化等项目; 在过往工作经历中,曾有保险行业通用监管上报数据模型,基于数据仓库的即时多维数据查询方案设计等成功案例。

14:35-15:25
  • 基于大模型的SQL前置审核系统

    基于大模型的前置SQL审核系统,该系统主要面向应用研发。目标:在研发代码发布上线前前置完成风险SQL识别(如:全表扫描、消耗cpu的排序,扫描行数过多等风险SQL)、实现风险SQL发现(告警群发送治理通知)、治理(认领/修复)、再识别(实时更新sql执行计划等信息)的完整闭环,降低低效sql发布线上发生稳定性风险次数,提升线上所有所有服务数据库稳定性,大模型在整个过程发挥SQL优化助手作用。

    • 王洪权
      某教育行业公司
      技术专家

      15年数据库行业数据库管理优化经验,曾任职于搜狐、网易、微博,阿里巴巴,担任dba、技术经理,技术专家,高级技术专家,《深入浅出MySQL:数据库开发、优化与管理维护(第2版)》作者之一,现任职某头部教育公司担任技术专家。

15:25-16:15
  • AI 多模态数据挑战下的统一接入架构演进与实践

    在大模型和多模态 AI 应用全面兴起的背景下,企业面临来自文本、图像、音频、视频、向量等多模态数据的复杂接入挑战。这些数据不仅分布于传统数据库与对象存储,还包含日益增长的多模态数据库与数据湖系统,要求在实时性、一致性与可编排性之间做出平衡。本次演讲将系统性阐述如何通过 Apache SeaTunnel 与 DolphinScheduler 的协同设计,构建统一、可扩展的数据接入架构,支撑多模态数据从采集、处理到入湖/入库的全流程,助力企业构建面向大模型训练与推理的智能数据底座。

    • 代立冬
      白鲸开源
      联合创始人

      代立冬,白鲸开源联合创始人;Apache DolphinScheduler PMC Chair & Apache SeaTunnel PMC & Mentor;Apache 孵化器导师;Apache Local Community Beijing 成员。作为开源积极分子,积极推广开源文化,担任历届 ApacheCon 亚洲大数据湖仓论坛出品人,并入选中国科协 “2023开源创新榜” 优秀人物。

专场16:大数据平台建设
13:45-14:35
  • 政务大数据存算分离架构建设和应用

    随着政务数据汇聚、共享、治理、开放、开发利用的不断深入,传统“存算一体架构逐渐暴露出资源利用率低、扩展僵化、运维复杂等痛点,成为制约政务大数据平台效能的瓶颈。福建省一体化公共数据平台通过引入对象存储与弹性计算分离架构,实现计算资源按需扩缩容,提升资源利用率、降低成本,支持弹性扩展应对数据波动,统一数据管理打破孤岛解耦技术栈加速创新,降低运维复杂度。一是存算分离架构通过“存储无限扩展+计算敏捷伸缩“双轨机制破局存储层基于对象存储天然支持PB级横向扩展无需预置容量。二是存算分离架构以“数据湖“模式(如Databend/lceberg)构建统一存储底座,所有部门数据以标准化格式(Parquet/ORC)存入共享池,通过统一元数据服务实现跨部门数据目录互通。计算层可直接访问共享存储中的原始数据,无需重复搬运或格式转换,有效提升数据共享效率。三是存算分离架构将技术栈解耦为独立的存储与计算模块,存储层可独立升级至新一代对象存储(支持智能分层、加密等特性),不影响计算任务;计算层则支持多引擎兼容(如Spark/Flink),可根据业务需求灵活选择--实时分析选用Flink的低延迟流处理,离线批处理选用Spark的高吞吐计算,AI建模选用TensorFlow的分布式训练。 存算分离架构通过资源解耦、弹性扩展、高可用保障、数据统一管理、技术解绑及运维简化六大核心能力,解决了政务大数据平台长期面临的“成本高、响应慢、协同难、迭代僵“等痛点。实践表明,该架构可使综合成本降低30%-50%,数据处理效率提升3-5倍,跨部门数据共享效率提升50%以上,为数字政府建设提供了可持续演进的技术底座。 演讲内容重点提纲: 1. 传统架构与面临挑战 (政务大数据平台传统架构遇到的问题等) 2. 存算分离架构与优势 (存算分离架构功能、流程示意图等) 3. 存算分离架构优化点 (统一入口、实时入湖、一数多用等) 4. 存算分离架构成效 (数据全生命周期管理、HTAP场景能力等)

    • 吴世钦
      福建大数据一级开发有限公司
      数据库专家

      吴世钦,数据库高级工程师,现任福建大数据一级开发有限公司大数据PaaS组件团队负责人,拥有16年的数据库领域架构与运维经验。长期从事电信和政务行业核心大型系统的PaaS组件选型、架构设计、运维调优等工作。擅长Databend、MySQL、Oracle、Hbase等数据库性能调优与高可用架构设计,活跃于数据库技术社区,多次被相关企业受邀分享数据库架构、数据库调优等实践分享。

14:35-15:25
  • 京东物流UData一站式数据分析平台建设实践

    面对物流行业数据来源多、需求变化快、报表样式复杂等独特挑战,京东物流UData平台以联邦查询引擎+低代码交互+AI增强分析为核心,重构了10万+业务人员的数据使用范式。平台突破传统BI工具局限,通过StarRocks存算分离架构实现千亿级数据秒级响应,结合DataGPT自然语言生成技术,将报表制作效率提升80%。本次分享将深入解析一站式数据分析平台核心架构和建设路径,涵盖架构设计哲学、性能优化实战及AI融合创新。 分享大纲与核心观点 一、业务背景:物流数据分析的困局 1.业务痛点 -数据孤岛:线上/线下/手工数据分散于20+异构系统,整合成本高 -报表复杂:嵌套表格、条件格式、多级表头等定制化需求(占研发资源70%) -效率瓶颈:手工Excel处理单报表耗时2小时,618大促日报需每日重复10次 2.产品规划 “让一线人员像操作Excel一样完成专业数据分析” 二、架构设计:联邦查询引擎与分层治理 1.三层核心架构 - 统一接入层:Flink实时+Hudi离线+API服务,支持多元异构数据源无缝接入。 - 联邦计算层:StarRocks向量化引擎+算子下推优化,跨MySQL/ES/CK关联查询提速5倍。 - 应用服务层:低代码配置+DataGPT+在线Excel插件,数据分析效率大幅提升。 2.关键突破 -数据编织技术:语义层自动对齐业务指标口径,消除“同指标不同义”问题 -轻量级集成:第三方Excel插件嵌入,保留用户操作习惯的同时实现自动化更新 -一站式分析:基于LLM的数据集构建与分析,数据处理与分析过程一体化打通。 三、性能攻坚:从可用到好用的能力进化 1.稳定性专项 - 故障分类复盘机制:定义数据/共享/操作三大类SLA指标(可用性>99.95%) - 智能物化策略:大表拆分+小表合并存储,减少70%冗余IO 2.性能三级跳 查询加速: - 本地缓存+向量化引擎 → P95延迟<10秒 - 聚合下推至底层引擎 → 6表关联查询从30s→6s - 实时保障:Flink Batch Publish Version策略支持日更新千亿级数据 3.易用性设计 - 交互简化:数据准备步骤从11步→6步(菲茨定律缩短操作路径) - 导航重构:二级菜单+席克定律精简选项(隐藏非常用功能) - 体验分级:按报表重要性配置性能SLA(如战报优先保障) 四、AI赋能:从分析到决策 DataGPT双引擎模式 大模型驱动:NLP转SQL+指标知识库,灵活探索式分析,准确率依赖数据质量。 配置化驱动:预置语义模型+规则引擎,高稳定性报表生成。 五、未来规划:实时数仓与AI代理协同 - ABI产品能力进阶:移动端、DataGPT预测性根因分析、面向外部客户的开放赋能。 - 架构升级:实时数仓与联邦计算层深度结合,AI+BI一体化处理。

    • 焦文健
      京东物流
      大数据产品总监

      京东大数据产品总监,中国人民大学MBA,中国信通院零售数据专家工作组成员,十年以上大数据从业经验,具有数据中台化、数据业务化、数据智能化的落地实践经验。主导产品曾获得 CCFA 中国连锁经营协会数字化最佳实践,获得工信部直属单位中国软件评测中心的优秀大数据产品及解决方案认证。

15:25-16:15
  • 大数据离在线混部在360的演进之路

    360大数据计算集群的资源使用率在凌晨很高,但白天使用率较低,存在明显波峰波谷现象,面临利用率不高但成本高的双重压力。而在线服务集群的资源使用率在白天高,但凌晨使用率低。大数据离在线混部利用动态申请弹性资源为大数据离线计算任务补充算力,通过合理优化资源、任务调度和隔离机制,保障大数据任务稳定运行,实现提升大数据集群资源利用率的同时降低成本的目标。 本次分享按照时间线介绍了大数据离在线混部技术架构在360的不断演进与发展,总结了项目的成果与收益,最后对项目的未来规划做了展望。 大纲: 大数据离在线混部项目诞生背景 大数据离在线混部技术架构的发展与演进 大数据离在线混部项目的落地情况及收益 大数据离在线混部项目未来规划

    • 张博亚
      360
      大数据计算负责人

      张博亚,360高级专家,北京航空航天大学工程管理硕士,从业已13年,长期专注于分布式系统研发,熟悉主流大数据计算引擎、数据仓库、数据湖以及OLAP技术。目前主要负责大数据计算底层引擎研发相关工作,聚焦架构治理、提升系统性能、成本优化、数据处理流程优化,并确保系统的稳定性和数据的准确性。

16:15-17:05
  • 自如Ai Ready的数据平台建设

    本次分享将聚焦AI浪潮下大数据平台的升级挑战,详细阐述自如的四大核心建设实践: 1、存储底座升级: 打造面向AI的高性能、可扩展存储架构,支持海量非结构化数据的低成本、高可靠存储,为上层AI应用提供坚实根基。 2、湖仓一体建设: 深度融合数据湖的灵活性与数据仓库的强管理及高性能分析能力,构建统一数据底座,提升分析效率与灵活性。 3、算法平台建设: 构建支撑模型开发、训练、部署与监控的全流程AI平台,提供高效算法工具链与大规模计算资源,加速AI落地。 4、混合云实践: 探索并实践私有云与公有云的高效协同模式,实现资源弹性伸缩、业务快速部署及多云融合管理,优化IT成本与效能。

    • 刘涛
      自如
      大数据平台研发经理

      2020年加入自如,拥有13年大数据领域相关经验,多次成功从0到1构建大数据平台。目前担任自如的大数据平台研发经理,负责离线计算、实时处理以及AI算法平台等基础设施的规划与建设。在大数据平台的架构设计、技术选型及团队管理方面具备深厚的积累。凭借深厚的技术功底和敏锐的业务洞察力,善于将数据能力与业务场景深度结合,实现数据赋能业务决策和运营优化。

专场17:Data+AI(下)
13:45-14:25
  • DataAgent在广告场景中的应用探索

    广告的数据分析与洞察,对专业性、严谨性和准确性都有较高要求。为向用户提供准确且高价值的信息,我们在Data + AI领域进行了深入探索与实践。本次分享将结合基于大模型的智能体(LLM-based Agents)的实际应用,探讨它们如何在组织、分工与协作方面高效运作,深入理解业务场景、调查数据源并整理用户需求,最终执行严谨的数据查询与分析洞察任务。同时,也将围绕上下文工程、权限控制等关键模块分享实践经验,阐述如何在保持语言模型灵活性的同时,确保数据的准确性。最后,基于当前数据库与大模型的技术趋势,对未来可能的应用方式和发展趋势进行思考。

    • 聂铭君
      京东零售
      副总监

      聂铭君,京东集团算法副总监,京东联盟广告算法负责人,在公司内部成功落地多个智能体及智能助手,包括商品推广助手、数据分析智能体等,发表国内外专利、论文15篇,在大模型应用领域的理论与实践结合中积累了丰富经验,并持续推进相关技术的创新与应用。

14:25-15:05
  • 高效的数据标注与处理,实现低成本的大模型训练与应用

    如今各行各业大数据应用发展如火如荼,欣欣向荣,大模型用户于通用领域效果取得了极大的提升,但是在定向领域,尤其是各类追求效果提升的领域,使用大模型来解决问题越来越力为从心。 但是大模型具备独特的优势,如参数量巨大,行业知识丰富,这些在定向领域是不可忽略的存在,所以大模型特定领域的应用提效呼声越来越强烈,其对于特定领域应用大数据的要求日益增高,普通的大数据处理方式,如简单的数据ETL处理,简单的指标计算与生成,越来越来不能捕捉到内在的深层规则与知识用于定向的效果提升,如想提升对话的轮数的增长,识别语义的粗度,推荐商品的下单率等等。 这些需求催生了大数据领域的变革,大数据需要与大模型的发展相结合,以其独特的数据处理,数据加工,指标计算,效果评估为目标,来应用大数据,更好的让大模型发挥其优势。 分类大纲: 如果更有效的利用大数据服务于大模型时代,提效大模型算法的效果。 (1)大数据如何进行高维embedding的生成,服务于大模型并feed大模型的微调应用 (2)大数据的服务大模型的思考,不同的应用场景(如分类,对话,问答,抽取,生成等),如何更有效的让模型学习到大数据背后的规则与经验 (3)时序大数据服务于大模型的思考,包括时序数据的准备,时序数据的向量生成,时间数据的Attention (4)大数据如何进行抽取采样,不同的场景的定侧重。 分享要求: (1)代成本的使用大模型迭代训练 (2)低成本的准备大数据feed 模型 (3) 如何使用大数据进行模型的加工 (4)大数据应用于模型的效果评估指标的调整。

    • 印彬锋
      国内头部互联网金融消费公司
      高级算法研究员

      早年2015年以前,先后在中国移动研究院,华为技术有限公司进行算法开发,2015年之后,负责国内头部房产中介线上租售房产的推荐算法的应用。近3年在国内头部互联网消费金融公司,任职高级算法研究员

15:05-15:45
  • AI模型鲁棒性缺陷和解决

    当前AI模型的应用领域已经广泛应用于互联网的推送,专业的问答,特定领域的信息识别和判断等。借助深度学习、LLM等方法,建立了非常多的数据模型。但这些模型,在应用于现实世界,都有着一些共同的问题:不够专业,臆测失真,鲁棒性较差等等。我们探讨这些问题的发生原因和机制,并找到可以解决的办法。 分享大纲: 1. 缺少专业性。获得足够的关键性的领域数据,是支撑AI服务可用性的基础。有效标注是关键。 2. 模型的失真。和现实物理世界相比,模型会有历史盲区问题,相关性陷阱和过度平滑。需要用实际的物理模型和专业知识来解决。 3. 忽略数据关联。过于干净的数据,也会导致模型鲁棒性变差。需引入一些“脏”数据。 4. 轻视实时。让数据链路具有更大吞吐支持实时建模。

    • 罗竞佳
      满帮集团
      大数据总监

      先后在中科院计算所(肄业),百度,满帮集团学习和工作。拥有20项计算机相关技术专利。2011年进入百度无线搜索部门,先后负责轻应用直达号的搜索和推荐,在百度糯米负责算法工作。 2017年加入运满满,从0到1建设了大数据平台、数据仓库和算法技术,建设了基础的标签,全国非标货源定价能力和干线公路车货匹配推荐系统。运满满和货车帮的数据和算法融合。后续负责拼车匹配的推荐和调度能力。

15:45-16:25
  • 火山引擎Data Agent:如何落地企业级分析智能体

    数据智能体 Data Agent (后文简称 Data Agent)是火山引擎依托大模型技术,推出的新一代企业级 AI 数据专家:“Data”代表其深度理解和运用企业数据资产的能力,“Agent”体现其作为企业的智能代理,能够像专家一样主动思考、分析和行动。 Data Agent 经历了抖音集团内部大用户量、高并发的考验与打磨,凝聚了火山引擎数智平台对于 Data+AI 的理解。 其中,智能分析智能体是一款基于AI深度思考与大数据分析的洞察研究专家,融合大模型的深度思考能力,运用交叉分析与归因分析等方式,以智能问数为交互基础,自动规划数据洞察大纲并执行任务,最终形成深度研究报告,达成智能洞察最后一公里,放大企业数智化基建与AI创新价值。 本次演讲重点介绍数据分析智能体产品与技术架构,以及在域内和To B客户的落地实践,希望能与听众一起探讨Agent未来的发展方向。 演讲内容重点提纲: 1. DataAgent整体介绍 2. 数据分析Agent产品与技术架构 3. 数据分析Agent效果演示与应用落地 4. 未来展望

    • 吴晓菊
      火山引擎
      Data Agent分析智能体技术负责人

      吴晓菊 火山引擎 Data Agent分析智能体技术负责人,南京大学软件工程硕士,10+年大数据领域技术专家。

16:25-17:05
  • AI如何重塑数据库管理模式

    在AGI快速发展的背景下,数据库管理模式正迎来全新变革。传统依赖人工经验及规则的数据库开发与运维流程,正逐步向智能化、自动化的AI Agent演进。本议题将围绕“AI如何重塑数据库管理模式”展开,重点探讨如何结合AGI能力构建面向数据库开发与治理的AI Agent,实现SQL代码生成,代码审核,代码诊断优化及数据库智能助手等核心能力,全面提升企业在数据管理效率与安全性方面的水平。

    • 周振兴
      NineData
      联合创始人&技术副总裁

      NineData联合创始人 && 技术副总裁 && Oracle ACE(MySQL方向) ,曾担任阿里云资深数据库技术专家、数据库业内畅销书《高性能 MySQL 》译者。