同花顺新三板

喜报!“国学时代”联合申报的《基于专业大语言模型的国学AI搜索引擎——“古今通”》作为北京首批高质量数据集资源建设成果对外发布
来源: 国学时代官微 2025-07-04 17:44:51 0

  7月4日,2025全球数字经济大会“数据要素发展论坛”在北京国家会议中心召开。“数据要素发展论坛”主题为“以改革创新加速数据价值释放”,系统展示数据要素市场高质量发展的创新实践成果,打造行业创新发展的前瞻性交流平台。在论坛上,集中发布了

  7月4日,2025全球数字经济大会“数据要素发展论坛”在北京国家会议中心召开。“数据要素发展论坛”主题为“以改革创新加速数据价值释放”,系统展示数据要素市场高质量发展的创新实践成果,打造行业创新发展的前瞻性交流平台。在论坛上,集中发布了重磅数据要素成果,进行了专业数据要素议题深度对话,并聚焦区域协同与国际视野。

  在本届论坛的成果发布环节,北京市政务服务和数据管理局发布了34项高质量数据集资源建设成果和19项应用案例。“国学时代”与中电数产天恒联合申报的《基于专业大语言模型的国学AI搜索引擎——“古今通”》作为北京市首批高质量数据集资源建设成果进行了对外发布。

  据了解,为深入贯彻落实国家数据局关于行业高质量数据集建设有关工作部署,加快构建本市行业高质量数据集开发利用体系,进一步发挥数据要素对“人工智能+”的赋能作用,北京市政务服务和数据管理局于6月3日公开征集行业高质量数据集需求和建设成果,聚焦工业制造、科技创新、文化旅游、社区服务、教育教学等16个重点领域,要求数据集能够直接用于人工智能模型开发和训练,有效提升模型性能,支撑相关业务场景落地,形成定期更新机制,并符合国家及北京市数据安全、合规管理相关要求。数据集可以是文本、图像、语音、视频、点云、时序等单模态数据集或多模态数据集,也可以是结构化数据集。

  “国学时代”与中电数产天恒(北京)数据产业有限公司联合申报的《基于专业大语言模型的国学AI搜索引擎——“古今通”》,拟开发适配文言文特点的中文大语言模型,通过加速古籍数字化进程,持续充实系统文献库;推进研究论著的数字化转换,开展数据测试与训练;建立健全学者个人数据上传机制,鼓励更广泛的学术参与,解决目前大语言模型由于对文言文语义理解和知识挖掘能力的不足而在古文智能分析方面存在的明显局限。在古籍标点、文献提要撰写等方面,实现智能辅助,提升工作效率,有效解放文史工作者的研究精力;实现研究成果数字化整合,运用大模型技术实现跨领域、多维度的知识关联;从而推动知识普及,促进文化传承,并赋能文旅、文创、出版等相关产业,创新发展模式。

  “国学时代”成立于2002年,是一家聚焦古籍数字化领域的国家级高新技术企业,2009年登录“新三板”,是北京市“专精特新”中小企业、瞪羚企业,北京市民营企业文化产业百强,北京市共铸诚信企业,入选《福布斯》中国潜力企业百强榜。

  从拓荒到深耕二十余年,“国学时代”支柱其间,取得丰硕成果,已成为中国古籍数字化领军企业和学术重镇。公司以多年积淀的庞大数字资源和领先信息技术为基础,形成了以古籍大数据服务为核心,数字国学及古籍文创为两翼的产品战略构架。现有的大型中华古籍全文检索数据库《国学宝典》拥有经过全面标点整理的中华古籍全文传世原典一万余种,总字数逾23亿字,超22万卷,内容包括先秦至民国两千多年的涉及哲学、历史、政治、军事、经济、天文、地理、科技、艺术、宗教、文学等各个领域,基本涵盖了历代重要的文献资料。

收藏: 0
0 0 0