深度培训课程
2020年12月20日是本次大会的深度培训环节,课程将从企业应用项目选型实施角度出发,全面而深入地向企业传达:针对某个应用方案的具体实现、选型比较、实现策略、成本对比、优势优点、自我经验,教训总结等内容。
本次共设置三门深度培训,为了达到最优实践效果,全部实行小班授课,名额有限,先到先得!
(注:12月20日当天三门课程同时进行,每位参课者只能选择其中一项内容学习;线上版不要求,可以购买多项。)推出的培训课程,分为线下现场培训和线上培训两种方式:
(一)、现场深度培训(价格(包括餐费)折后3000元/人)1、时间安排:DTCC大会结束后,展开小班制的现场培训;
2、现场培训后,将在ITPUB技术栈设立课程专区,参课者可以持续观看视频巩固学习;此外,授课讲师还将在专区内,定期对大家的课后疑问进行解答。
(二)、线上专题培训(价格1500元/人)1、时间安排:现场深度培训后,我们将课件上传到课程专区中,参课者可以重复观看视频;
2、授课讲师还将在专区内,定期对大家的课后疑问进行解答。
如想单独购买,可点击下方“立即购票”,选择相应的课程。注意:区分线下培训版、线上培训版。
除了几项线下培训内容,ITPUB 还可以提供后续付费支持服务,帮忙实现整个项目的落地实施,欢迎咨询。
- 深度培训:
- 企业知识图谱的设计、搭建和应用(本课程仅支持线上授课)
一、课程背景
1. 知识图谱:是什么、为什么、怎么实现?
知识图谱源自于知识工程中语义网络,并且结合了机器学习、自然语言处理、知识表示和推理的最新成果,在大数据的推动下受到了业界和学术界的广泛关注。近年来,基于图构建知识图谱成为研究和应用的热点。基于图数据库及相关技术构建、表示、存储、查询和学习知识图谱是当下最为流行的技术之一,且有着巨大的应用潜力。然而,另一方面,关于知识图谱的定义、方法、实现和应用涉及领域广泛、理论繁杂、工具众多,令人无所适从。本课程将对知识图谱的全生命周期进行定义,并在此基础上梳理出每个阶段中的主要内容和发展趋势,帮助学员建立清晰的知识图谱。
2. 基于图数据库实现企业知识图谱的存储、推理和查询。
结合全球领先的图数据库软件 Neo4j,依托企业和市场的实际需求,从零开始系统全面地介绍和培训企业知识图谱的设计和应用,包括知识图谱的表示、构建、推理和应用;基于数据库的图算法理论基础。通过样例数据集和实际应用场景,帮助学员完整掌握应用相关技术搭建实用的企业知识图谱的核心思想、适用领域、实践应用,并能在各自的行业和研究领域灵活熟练地运用相关知识和工具。
3. 以概念和理论为基础、语言和算法为工具,通过在实例数据上的操作建立对知识图谱的真实感受和实际应用体验。
理论结合实践,将复杂枯燥的算法与易于理解的应用场景有机结合,帮助学员建立起从提出问题->确定适用的理论->选择可用的工具和过程->验证分析的结果、端到端的分析和处理技能。
4. 持续学习、不断提升。
为期1天的深度培训,虽然会尽量做到深入全面,但参加受训的你在真正要实施时还会遇到很多问题。因此在ITPUB社区,就这个话题,我们会提供针对性问题的、有偿问答服务,并持续推出相关课程,让你有信心通过不断学习和实践,成为在大数据分析、知识图谱等领域的专家和技术大V。
二、课程介绍
知识图谱与大数据、深度学习,这三大“秘密武器”已经成为推动互联网和人工智能发展的核心驱动力之一。在国务院颁发的《新一代人工智能发展规划》(国发〔2017〕35号)中,明确指出“关联理解与知识挖掘、知识图谱构建与学习、知识演化与推理、智能描述与生成等技术”为新一代人工智能关键共性技术体系的重点突破领域。
知识图谱以知识工程中语义网络作为理论基础,并且结合了机器学习,自然语言处理和知识表示和推理的最新成果,在大数据的推动下受到了业界和学术界的广泛关注。近年来,基于图构建知识图谱成为研究和应用的热点。基于图数据库及相关技术构建、表示、存储、查询和学习知识图谱是当下最为流行的技术之一。
本课程期望从知识图谱的历史发展、方法论及工具出发,通过介绍应用趋势、技术难点,以及在大数据时代的机遇和挑战,为学员展现一个崭新的、潜力无穷的、充满活力的技术应用领域。
具体内容方面,本课程主要讲述建立企业知识图谱的相关技术和工具,包括但不局限于:
• 知识的表示:符号,向量和图(RDF、属性图);
• 知识的存储和查询:Neo4j 图数据库,Cypher 查询语言;
• 知识图谱的推理:图的机器学习算法例如社区检测、页面排行、相似度、链接预测等;
• 知识图谱的应用: 基于样例数据,提出问题、并应用所学知识和工具回答问题。
课程时间为一整天,其中授课、实操和讨论的时间占比为6:3:1。
三、课程收益
1. 了解知识图谱的发展历史、应用趋势和相关技术领域;
2. 掌握如何根据应用需求,规划、定义、构建和使用知识图谱的完整方法论;
3. 掌握基于图的知识表示方法,以及如何在企业级图数据库平台 Neo4j 上搭建知识图谱应用的过程和工具;
4. 掌握 Cypher 图数据库查询语言进行建模、查询和更新数据库的方法;
5. 掌握常用图算法,以及如何将这些算法应用到知识图谱的推理中,以发现新的知识、更好地解决实际应用中的问题;
6. 了解图数据库与关系型数据库、以及其他 NoSQL 数据库的区别,根据业务类型决定使用正确/适合的数据存储类型,并充分利用不同类型数据库的优势满足业务需求。
四、课程对象
1. 计算机软件和数据库领域各类型企业的技术主管、项目经理、架构师、数据科学家、开发人员;
2. 计算机软件和数据库领域大专院校相关专业在校学生;
3. 希望通过学习和掌握知识图谱和图计算相关技术提升自身专业水平和竞争力的社会人士;
4. 未来有意愿从事与知识图谱、图计算、机器学习技术相关的从业人员。
根据课程内容深度和实践操作内容,有意报名的参课者最好有如下一些准备或者经历:
• 熟悉关系型数据的基础理论、数据库建模和 SQL 应用开发;
• 熟悉算法和数据结构,特别是图相关算法例如遍历、排序、搜索;
• 了解一些机器学习相关技术和应用知识,例如自然语言处理(NLP)、有/无监督的分类、向量空间、神经网络等;
• 了解 Web 应用相关标准和技术,例如 XML、RDF、语义网络、本体模型等;
• 如有 Neo4j 图数据库使用基础则更佳。
五、课程大纲
六、讲师简介
俞方桦博士,Neo4j 亚太地区技术专家,IEEE 和澳大利亚计算机学会会员
二十多年 IT 从业历史,行业经验跨越政府、零售、金融、科技、制造,专注领域涉及大数据、商业智能、AI 和机器学习、云计算、软件开发以及儿童编程教育。
目前担任 ITPub 图数据库特邀专家、Neo4j 中文社区专家、《Neo4j 图数据库丛书》第3卷执行主编,组织和主讲图数据库技术聚会(GraphDB Meetup)悉尼分会。
【讲师资质】
• 博士学位
• PMP2000 证书
• 微软高级培训证书
• COGNOS 全部产品认证
• TIBCO 产品认证
• Teradata 物理数据库设计认证
• 金融市场高级学位证书(Hubb Institute)
• SAP BP(业务伙伴)模块认证
• AWS 云服务架构师认证
• IASA 国际架构师协会认证证书
• 哥伦比亚大学 Data Science 课程认证
• Neo4j 技术专家认证
立即购票
- 深度培训:
- 借鉴 Oracle,深入修改 MySQL/PostgreSQL 内核代码
一、课程背景
1. 掌握研究开源数据库的方法,构筑自主可控的知识体系。
中美在贸易、技术等方面的冲突,特别是美国对中兴、华为的制裁,让我们从全民到国家层面都意识到,一味的“拿来主意”,已经不适合中国以后的发展,只有保证核心技术的自主、可控,才是发展的硬道理。在这种外部大环境的推动下,对开源数据库内核技术的研究,渐渐成为大势所趋。但成熟的开源数据库,动辄上百万行代码,让企业与技术爱好者无从下手。在学习、研究过程中,企业与技术爱好者大都面临两个重要问题。
1) 超长时间的学习、研究周期,而且在期间没有产出(只有时间、人力的投入)
2) 没有参照、没有对比。无论是源自图灵奖得主斯通布雷克的 PostgreSQL,还是应用广泛的 MySQL,它们的代码一定都是千锤百炼的。我们何德何能,敢对这些高品质代码动刀!
第一个问题:学习/研究周期长。可以用“基于调试数据库的正向反馈”法解决。这种方法的介绍,将是本课程的重点。我们不可能在十数小时课程中,将百万行的代码历数一遍。因此,分享阅读源码的方法,才是本课程的重点。“基于调试数据库的正向反馈”法,可以让我们在漫长的学习/研究周期中,不断有成果、有产出。比如,为开源数据库提供像 Oracle 一样测试、观察性能的工具等。这种产出可以奖励我们不断前进下去。
授人以鱼,不如授人以渔。本课程将重点放在“渔”上,为有志于在开源领域发展的企业和技术爱好者,提供方法。
至于第二点,“没有参照”。其实有一个很好的参照:Oracle。若论技术上的先进性,Oracle 无疑仍是最先进的数据库之一。而且 Oracle 累积了大量的成功经验。参照 Oracle 的原理与机制,对 PostgreSQL/MySQL 做一些调整,最终达到自主、可控,将是成功的最佳路径。本课程将以 Oracle 部分原理为例子,实例讲解如何参照这些原理,修改 PostgreSQL 或 MySQL。
2. 掌握用户态、内核态动态跟踪的方法,构筑自己的职业壁垒。
对于开发、DBA,或是其他数据库相关从业者,构筑自己的技术壁垒十分重要。本课程的“调试数据库”方法,将综合运用操作系统原理与数据库原理。这将使我们对原理不仅仅停留在了解之上,而是要进一步的运用。“纸上得来终觉浅,绝知此事要躬行”。只有去运用从“纸”上学到的原理,这些原理和变成自己真正掌握的知识。而且,使用调试数据库方法,在以后的学习、研究过程中,还将不断加强自己对计算机体系底层、操作系统原理、特别是数据库原理的掌握与运用。这种底层原理性知识,将形成自己的技术壁垒,使自己在 IT 领域立于不败之地。
3. 除了本次深度培训,还会提供后期的跟踪问答
为期1天的深度培训,虽然已经相当深入全面了,但如果参加受训的你,真正开始调试数据库,可能还会遇到很多问题,针对这种情况,在 ITPUB 社区,我们会针对这个话题,进行后期的针对性问题的有偿问答服务,让你真正掌握调试数据库技术,可以使用此种技术去分析、甚至是修改一个开源数据库的内核。
二、课程介绍
数据库技术的发展,在国内已经进入下半场。很多企业不再停留在单纯的使用与运维,“自主、可控”已经是所有企业的共识。在需求推动下,对数据库内核技术的研究,也如火如荼的展开。本课程主要为大家分享使用调试技术研究数据库内核的方法,以及如何将研究结果应用到日常场景,以帮助我们更好的运维、使用数据库,满足应用需求。并且重点为大家分享如何参照 Oracle 在超高并发、极短响应时间的成熟经验,对 PostgreSQL/MySQL 的源码在某些方面进行改进。
本课程从 System tap、DTrace 等动态跟踪技术和 gdb 调试技术入手,课程内容虽涉及大量数据库原理,但重点还在于讲述如何发现、发掘这些原理,并对其中可以改进的点进行改进。也就是说,本课程重点在于“方法”,而不是简单的罗列各种数据库的原理。
另外,Oracle 数据库的一大特点是“可观测、可测量”,这是说 Oracle 拥有非常丰富的性能资料与等待事件。可供有经验的 DBA 全方面的分析性能瓶颈。本课程还将讲述,使用动态跟踪技术,为 PostgreSQL/MySQL 增加类似 Oracle 的性能资料统计,和竞争分析工具的方法。
整个课程大体上分为四大部分:
1. 常用调试与动态跟踪技术介绍。
2. 使用调试数据技术,分析 PostgreSQL 或 MySQL 的逻辑读、解析、Redo Log Buffer 操作、事务处理的原理。
3. 使用动态跟踪技术,增加 Oracle 类似的性能分析工具。
4. 如何参照 Oracle 原理,找出可供改进的点。
三、课程收益
1. 掌握调试数据库技术。
2. 掌握阅读开源数据库代码的方式。
3. 掌握分析数据库原理的方法。
4. 掌握使用动态跟踪技术为 PostgreSQL/MySQL 增加性能观察工具的方法。
5. 掌握影响高并发数据库的要点,以及如何衡量一个数据库的优劣。
6. 了解动态跟踪技术内核态跟踪的方式。
7. 了解动态跟踪技术分析 Linux 内核的方法。
四、课程对象
开发、DBA、系统架构师,对开源数据库技术感兴趣的人员
根据讲师的经验与授课体系,有意报名的参课者最好有如下的一些准备或者经历:
1. 有 Oracle/MySQL/PostgreSQL 至少一种数据库使用经验,并至少对其中某一数据库常见原理有基本了解。
2. 对 Linux 操作系统常见原理有基本了解。
3. 对 Linux 的编程有一定的了解(Linux下c开发最佳),如果没有涉及过,请提前准备相应的资料,并提前准备学习一下。
五、课程大纲
六、讲师简介
吕海波(花名:VAGE)美创科技 技术专家/首席研究员,ITPUB管理版版主
IT老兵,24年IT领域从业经历,十数年数据库经验,惯看IT江湖风起云涌。曾在多家巨头型互联网公司从事数据库管理与研究工作。2009年曾就任阿里巴巴高级数据库专家(P8),并于2014年以特招方式进入国际电商巨头eBay(eBay全球唯一无法英文听说的技术人员),从事数据库管理与研究工作。目前主要研究方向数据安全、数据库内核。
出版技术书籍《Oracle内核技术揭密》,被誉为国内最深度解密Oracle算法原理的技术书籍。
【讲师资质】
目前拥有技术专利一项,在申请中专利二项。
多届数据库大会演讲嘉宾
出版技术书籍《Oracle内核技术揭密》
正在著作《数据处理技术之旅》(暂定名)
立即购票
- 深度培训:
- 敏捷数据中台、开放AI中台和智能机器人产品的建设实践
一、课程背景
宜信在2017年推出了一系列大数据开源工具,在技术社区内得到了广泛关注和好评,包括大家熟悉的DBus、Wormhole、
Moonbox、Davinci,并基于四大开源平台之上形成一套“敏捷大数据架构”方法论。2019年,宜信基于四大开源平台和敏捷方法论,建设了公司统一的“敏捷数据中台”,并在全公司推广使用。
与此同时,已经内部孵化的AI中台、机器人产品,也开始在公司内部各个业务方广泛使用和遍地开花,得到各个业务方的认可,并为公司节省大量人力成本。
本次分享将会介绍我们的敏捷数据中台、开放AI中台和机器人平台的建设之路,各个平台既有独立性又有关联性,并会深入到设计、架构和实践层面进行讨论,可为各个公司建设自己的数据中台和AI中台提供一个参考和借鉴。
二、课程介绍
本课程主要和大家探讨在企业中,面对业务方海量数据,快速和多样化的数据需求和智能化需求,企业内部如何构建符合企业目标的数据中台和AI中台,数据中台和AI中台提供哪些能力来满足业务快速迭代的需求,数据中台和AI中台如何数据打通,以及基于这些能力构建的一些典型数据应用场景和AI应用场景。最后重点介绍一个基于AI中台能力的数据智能应用 - 智能外呼和聊天机器人产品,以及如何利用已有AI中台能力快速支撑和服务这样的智能数据产品。
具体来说,本次分享大致涵盖3个子主题:
1.敏捷数据中台建设以及应用场景案例
• 宜信敏捷数据中台顶层设计: 定位和价值、高阶模块架构;
• 从开源工具到数据中台: 开源平台架构和设计、数据中台架构和设计、数据中台与数据湖;
• 典型数据应用场景案例: 基于数据中台的企业典型数据应用案例介绍;
2.开放AI中台建设以及应用场景案例
• AI 中台应解决的业务痛点、提供的能力、数据中台和AI中台的边界和联系、以及AI中台的定义;
• AI 中台的实施路线:开放AI平台架构、平台能力、主要功能组件、总体运转流程;
• 实例分析:基于AI中台能力的具体智能化应用案例介绍;
3.基于平台化思想建设的智能机器人产品实践
• 智能机器人平台设计思想、定位和解决的痛点,算法、工程和业务的统一;
• 智能机器人平台实施路线:平台架构和设计、各种机器人的算法实现原理、以及如何复用AI中台平台能力;
• 智能机器人平台典型案例分析和实战。
课程时间为一整天。
三、课程收益
本次分享可以帮助大家:
1、从0到1的学习和了解数据平台、AI平台、智能数据产品在企业中的整体面貌;
2、了解数据中台、AI中台的设计理念、定位、价值、边界和关系;
3、了解和掌握使用开源工具如何构建一个现代化敏捷数据中台,以及典型数据应用场景;
4、了解和掌握如何构建开放AI中台,以及基于AI中台的智能应用场景;
5、了解智能机器人产品的价值、用途、设计原理和应用场景。
四、课程对象
CTO、大数据工程师/高级工程师/架构师、AI平台工程师/高级工程师/架构师,AI工程师/高级工程师/架构师
对数据和智能平台架构感兴趣的开发人员
根据讲师的经验与授课体系,有意报名的参课者最好有如下的一些准备或者经历:
• 对智能数据产品或平台一定经验或感兴趣;
• 有过一定架构经验,或对平台化建设有一定经验或感兴趣;
• 课程涉及具体技术包括JEE技术、大数据技术和人工智能技术,建议对这些技术有一定了解,有过相关开发经验为佳。
五、课程大纲
六、讲师简介
王东宜信科技中心AI中台部负责人,高级架构师
大数据技术和人工智能技术专家,研究领域方向包括大数据基础平台、实时数据归集和处理技术、智能聊天/语音机器人平台、开放AI平台建设和推广等。拥有10年以上金融和互联网企业基础系统和数据类平台研发经验。擅长平台级产品建设、数据类/智能类产品研发和架构。宜信敏捷大数据栈DBus开源项目负责人,CUBRID-cluster开源项目发起人。曾任职于韩国最大搜索引擎公司Naver资深工程师,主持
CUBRID-cluster分布式数据库引研发和负责CUBRID数据库引擎研发工作。目前负责宜信AI中台和智能机器人平台的建设工作。北京大学软件工程专业硕士。
立即购票