8月27日,由百分点科技和机器之心联合举办的数据智能技术实践论坛成功举行。本次论坛主题为“从数据到知识的‘智变’”,百分点科技CTO刘译璟作为本次论坛的主持人在致辞中表示,随着大数据与人工智能技术交叉融合态势的日趋增强,从数据到知识的转换过程及应用也在发生多重“智变”。希望通过本次论坛,能促进大家对数据智能技术发展及实践应用的探讨,加深产学研之间的相互交流。
本次论坛特别邀请了百度视觉技术部主任架构师刘经拓、百分点科技数据开发部负责人马伟凯、复旦大学教授肖仰华和百分点科技首席算法科学家苏海波分别做了主题演讲,从感知、数据治理、认知各个层面详细解读了数据到知识是如何一步步地发生变化并支持智能应用的。
融合创新,从“治理”到“智理”
近年来,伴随数字政府的快速落地,无论是数据的生产环节还是治理环节,都对数据智能技术应用提出了越来越高的需求。计算机视觉作为在感知层的核心技术,在结合城市感知、工业能源、人机交互、视频生产等业务场景中得到了不断发展。同时,数字政府项目中还存在众多的文本、语音等形式复杂的非结构化数据,如何基于视觉技术及政府已经有的业务数据进行多模态数据的融合,以及运用智能化技术的实现高效的“智”理,对支撑数字政府智能应用、提升治理水平起着至关重要的作用。
百度视觉技术部主任架构师刘经拓在《融合创新——计算机视觉技术与产业化发展之道》的主题分享中介绍,随着行业应用的逐步深入,通过某个单点算法创新就能大大提升应用效果的方式已不复存在,需要用全流程、全栈的方式。因此,为了实现更好的技术发展和落地效果,百度在技术和产业两个维度上都进行了融合创新,提出了计算机视觉领域从预训练、定制化到小型化,以及平台化的一体化的研发方案。具体来说,首先通过用超大规模非结构性的数据做预训练,能够在同样少量数据的情况下取得更好的效果;定制化是指结合特定场景进行自适应迁移学习,根据场景数据进行有监督定制化调优;小型化主要是基于模型剪枝、蒸馏、量化等技术,对模型进行裁剪。
他表示,大规模有监督数据的技术红利逐渐减弱,AI新基建需要更低的研发与部署成本,通过预训练与自训练平台,最终还要沉淀成标准化、低成本复制的模型,并与产业进行更深度的融合,挖掘出更多降低人工成本的新应用点。
百分点科技数据开发部负责人马伟凯在《从“治”理到“智”理,多模态数据管理PAI应用方法论》主题分享中表示,数据治理中的技术挑战除了数据孤岛、数据质量等问题,还存在多模态下如何解决数据不可用、不能用及不好用等挑战。他介绍,基于多源异构数据源的复杂场景下数字政府数据治理项目,百分点科技沉淀了一套数据治理“PAI”实施方法论,即流程化(process-oriented)、自动化(automation)、智能化(intelligence)。通过引入机器学习算法、NLP等数据智能技术,可以更好地开展数据治理工作,建立全域数据标准、提升数据质量、盘活数据资产,从而支撑数据融通,最终释放数据价值指导业务创新。
他认为,未来数据治理领域会有四大应用趋势:一是智能化建模和数据加工优化,需要不断地提升建模的能力沉淀到知识库;二是智能化完善数据安全管理,包括智能化控制数据权限分配、智能化数据审计并制定数据加密脱敏策略;三是智能化设计并维护数据生命周期管理,由于数据量大有时候不一定是好事,对于很多单位来说可能是负担,因此智能化识别数据、智能化制定数据保留策略非常重要;四是与Data Fabric更好的融合,增强数据目录,实现动态的获取数据,保证数据的安全。
数据到知识的“知”变与“智”变
在实践中,行业客户对知识图谱的应用诉求愈发强烈,核心需求是将行业数据知识化,并通过搜索、推荐、问答,以及用知识辅助进行更加智能的决策。因此,将结构化和非结构化的数据有效的“智”理起来后,能够进行数据和知识挖掘,提取当中有价值的信息,并以可视化的分析,为政府和企业决策提供支持成为当今亟待解决的问题。
复旦大学肖仰华教授在《知识图谱技术及行业应用实践》的主题分享中表示,作为大数据知识工程的典型代表,知识图谱技术近年来取得了长足进步,并在一系列实际应用中取得了显著效果。但随着应用的深化,知识图谱的落地过程单靠其所代表的知识智能本身这套技术体系和范式已经难以解决很多问题:一是数据获取和治理困难;二是在知识层面,小样本、低资源情况下知识的表示和获取代价仍然非常大;此外,获取知识之后,在应用、服务能力方面也存在很多挑战。
因此,未来破题的关键在于要突破以知识图谱为代表的知识智能的边界,向认知智能这样的智能新形态发展。他认为,认知智能作为数据智能、知识智能融合创新产物,将是知识图谱等知识工程技术发展的必然归宿。
百分点科技首席算法科学家苏海波在《知识图谱技术及行业应用实践》主题分享中表示,近些年,人工智能逐渐从感知智能向认知智能发展,知识图谱则是实现认知智能的关键技术方法,在构建出知识图谱后,可以实现各种智能场景应用。苏海波以此为背景介绍了百分点科技知识图谱抽取、知识图谱问答等技术的算法原理和实践,以及在多个行业场景中的具体应用。
他强调,未来知识图谱一定会深入到各行各业,未来五年将呈现三个趋势:一是通过人机结合的方式,自动化程度越来越高;二是知识图谱的多模态发展;三是知识图谱与数据治理相结合。只有掌握通用的人工智能技术,并将技术和业务需求对应起来,才能真正发挥出知识图谱的价值,解决行业问题。
当前,已经进入到一个从数据到知识的“智变”时代,随着大数据、知识图谱、NLP等数据智能技术的进一步成熟,数据中的价值将不断被挖掘利用,帮助我们进行合理地决策。未来,百分点科技也将继续结合行业需求,融合“政产学研用”产业生态链条,联合业界伙伴和产学研各界专家,深化布局大数据和人工智能全栈技术,打造从感知、认知、决策到行动的端到端的智能决策闭环,真正赋能各行各业。
-
397 厂家供稿
-
243 互联网
-
368 互联网
-
199 互联网
-
271 互联网
-
277 CTI论坛