用友网络科技

高质量的数据与知识治理,让 AI决策更靠谱!
2025年11月17日

 

2025 年,DeepSeek 带火 “大模型 + RAG” 模式后,很多领先的企业发现,虽然已经做了数据治理,但是大部分企业的数据基础还并不能达到 AI运用所提出的新要求,无法有效支撑AI的高价值场景落地。因此,面对AI应用落地的需求,企业做数据治理时,需要叠加知识治理,为企业决策提供充足有效的数据与知识来展开,为AI提供“高营养含量的粮食”。


找出3 个 “拦路虎”

别让知识变 “废柴”


AI 建设方式的转变后对企业私域数据的治理要求也变了。去年的核心是 “为模型训练准备数据”:垂类模型依赖高质量的专属数据集,数据治理聚焦结构化数据的准确性、完整性、多样性。而今年转向了“为检索准备多样化的知识”。很多企业卡在三个痛点 :


痛点 1:非结构化知识 “躺平”,大量隐性知识没被激活

企业里大部分数据是文档、视频、IoT 日志这类非结构化数据,但很多企业还在用 “文件夹分类” 的老办法管理。比如一家制造企业,大量设备维修手册散在不同系统,有的是 PDF 扫描件,有的是 Word 草稿,AI 检索时要么 “读不懂” 扫描件的手写批注,要么分不清不同版本的差异。


更头疼的是,这些知识还在不断增加:每月新增合同、客服聊天记录等,却没人 管 “哪些该归档”“哪些要标注关键信息”。这些 “躺平” 的知识,其实是企业的 “隐形资产”,却因为没治理,变成了 AI 检索的 “负担”。


痛点 2:知识切片 “乱切”,RAG 变成 大海捞针

就算非结构化数据整理了,AI 检索还是不准,问题可能出在 “切片” 和 “召回” 上。比如某金融企业,把一份信贷政策文档 “一刀切” 分成多段,结果 AI 要找特定条款时,相关内容被拆在多个切片里,召回时只抓到部分,自然给不出准确建议。


这就是“缺乏标准化的切片与召回机制”:有的切片太粗,把不同主题混在一起;有的切片太细,破坏了知识的逻辑关联;召回算法只认 “关键词匹配”,不会理解 “同义词”—— 比如 “逾期客户” 和 “不良信用客户” 明明是一回事,AI 却当成两个概念。明明有知识,AI 却 “不会用”,比没知识更让人着急。


痛点 3:知识治理 “没规矩”,AI 输出不可信

知识的质量把关没跟上,导致知识的时效性、准确性、权威性无法校验。


很多企业没有明确的规则:谁来负责知识的 “更新时间标注”?如何验证知识的 “准确性”?过时的知识怎么及时下架?结果就是 AI 基于 “带病知识” 输出建议,管理层如果用错了,损失将不可估量 。


AI应用下的数据治理

三个 “转向” 很关键


在面向企业AI应用落地需求下的数据治理,并不是简单的 “换工具”那么简单,而是要 “换逻辑”。数据治理有三个核心转向 :


转向 1:治理目标,从 “喂饱模型” 到 “帮人决策”

去年很多企业做数据治理,是为了训练垂类模型,重点是 “数据准不准”。但如今,治理目标变成了 “让 AI 能给出可靠的决策建议”。 比如销售经理问 “这个客户该不该推高客单价产品”,AI 要能快速检索到 “客户历史消费、信用评级、服务反馈” 等知识,给出有依据的建议。简单说,过去是 “为模型准备数据”,现在是 “为决策准备知识”。


转向 2:治理对象,从 “结构化数据” 到 “多模态知识”

过去数据治理的重点是 ERP、CRM 里的结构化数据(比如客户姓名、订单金额),但今年必须覆盖 “全类型知识”:合同、规范等 文档;设备运行、系统操作等日志 ;施工照片、产品图纸等影像。治理的核心也从 “标准化数据” 变成 “激活知识”:把扫描件里的文字 “读出来”,把视频里的关键步骤 “标出来”,把分散在不同系统的知识 “连起来”,就像把散落的珍珠串成项链,AI 才能 “拎得动”。


转向 3:治理模式,从 “项目式突击” 到 “常态化运营”

过去很多企业做数据治理,是 “搞项目”:找个团队集中一段时间整理数据,项目结束就停了。但如今,知识每天都在新增、变化,比如新的行业规范出台、客户需求更新,治理必须 “跟着业务走”。


这就需要 “自动化工具 + 长期组织”。用友建议可以用 DataOps 工具自动同步新数据,用智能体定期检查知识质量,再成立专门的 “知识治理小组” 负责规则制定、问题整改。


用友BIP企业AI

为AI应用搭起 “高速路”


数据与知识是数智化的核心生产要素,企业需要构建统一的数据平台,整合分散在企业各处的数据与知识,通过清洗、标注、建模或者图谱化、向量化等过程,形成标准化、高质量的数据资产与知识,为精准决策、智能运营提供支持,面向AI提供高质量的数据与知识的供给。这些都需要企业加强与更好地开展数据治理与知识治理。

 


1、破 “非结构化空白”:用平台激活隐性知识

针对非结构化知识 “躺平”,用友的核心是 “先整合,再赋能”:


全类型知识接入:用友 BIP 的 “企业数据云”, 作为底层支撑,汇聚了企业业务大数据、企业知识资产数据以及用户行为数据,为上层模型 和应用提供丰富且关键的数据源。


YonGPT 模型矩阵支撑:YonGPT2.0 升级的模型矩阵里,有专门的多模态大模型,可以低成本的选择适合企业场景的模型。友智库基于YonGPT构建的 企业级数智化搜索平台 ,聚焦企业知识管理与智能搜索场景,可支持非结构化数据的搜、问、推、创等知识库场景。提供“沉浸式”对话交互体验,助力企业快速获取行业、领域及内部知识资产。


 

友智库让知识无处不在


2、破 “切片召回不匹配”:让检索结果准确

针对切片乱、召回难,用友的 RAG 框架做了 “专项优化”:知识切片不是 “一刀切”,而是按 “知识逻辑” 切。 比如一份合同,会按 “合同主体、权利义务、违约责任” 分成对应切片,表格数据单独做 “结构化处理”,避免关键信息被拆;基于企业私域的知识库、知识图谱,将知识嵌入业务。企业级数据与知识库的深度整合,将企业内部的业务数据和专家经验转化为知识形式,通过实体、关系和属 性的定义,通过知识图谱构建一个结构化的知识网络。在这个网络中,企业的产品信息、客户数据、业务流程等 元素相互关联,为 AI 模型提供了一个全面且语义丰富的知识基础。


3、破 “治理没规矩”:需要专业组织来保障

针对知识质量没保障,用友、认为必须有相应的组织来长期负责数据与知识的运营,从制度、 流程以及内部沟通的流畅性方面保障数据与知识治理工作。这一组织体系应明确职责划分、促进跨部门协作、具备专业实力,并持续寻求改进,以支撑企业的数据与知识管理活动。


为了保证知识问答的准确性,用友RAG框架在文档解析、文档AI检索召回策略上做了深度优化,支持针对不同非结构化文档进行快速索引,根据业务知识库规范构建业务标签,利用知识图谱实现知识的关联化和体系化,最大限度的提升知识问答的准确性,以确保能在项目商用过程中切实为客户赋能。


企业AI 应用,如果知识还是乱的、检索还是难的,再先进的大模型也无法发挥价值。用友BIP企业AI让 AI 能快速调用知识,给出靠谱的决策建议,让AI真正发挥价值。


企业AI落地路径


           

           

           

           

           

           

           

           

           

           

           

           
         

       

       

       

       

       

       

       

       

       

       

       

       

       
图片        

       

电子书下载


       

       

       

       

       

       

       
图片        

       
图片        
图片        

       
图片  
图片        
图片        
图片        

       
图片        
图片        

       
图片  

 
图片  


湖北粮网 湖北粮网 湖北粮网 湖北粮网 湖北粮网