时值新冠疫情肆虐全球,面对这个人类共同的敌人,科学是战疫的最有力武器。为保障人民群众生命安全和身体健康,许多科研工作者们正在不懈努力寻找突破。
近日,由中国中文信息学会语言与知识计算专业委员会主办的——第十四届全国知识图谱与语义计算大会(简称:CCKS ﻪ2020)进入第二轮筹备阶段,相应的CCKS技术评测任务也已经正式发布。其中,健康科技公司妙健康发布了《新冠知识图谱构建与问答》评测任务,期望参赛者利用算法优化人工智能疫情知识问答系统,提升应用的准确性和专业性,进而普遍推广助力疫情防控,同时探索下一代医疗智能问答技术。
此前,在OpenKG(开放知识图谱联盟)总体组织协调下,部分相关企业院校使用自动化的技术,以新冠病毒为核心构建了包括新冠百科、健康、防控等多个高质量的知识图谱,并于此针对图谱构建的关键技术及其核心应用。作为心系国民健康的医疗健康企业,妙健康肩负起社会责任,与阿里云、百度、华为云、医渡云等科技巨头同台竞技,一同展现AI工业界的前沿创新。在健康管理领域深耕多年的妙健康,已经沉淀和积累了海量健康数据,也为此次大赛开放包括健康、防控、临床等多个具体数据集。
据了解,CCKS是自2016年以来每年定期举办的全国年度学术会议,CCKS 2020 ﻪ将于今年8月15日至8月18日在南昌召开。该大会一直致力于促进中国语言与知识计算领域的学术研究和产业发展,为从事相关领域理论和应用研究的学者、机构和企业提供广泛交流的平台,已成为国内知识图谱、语义技术、语言理解和知识计算等领域的核心会议,帮助学术成果与产业需求的融合和对接,不少企业和高校都踊跃参与。
(CCKS 2020大会官网
本届活动中,妙健康人工智能研发团队承担起任务组织者的角色,凭借在知识图谱领域出色的技术实力和丰富的实践经验,与清华大学、北京大学王选计算机研究所等知名学术机构联手,提出第四个“知识图谱的自然语言问答”任务。
具体来说,本次《新冠知识图谱构建与问答》评测任务是在OpenKG上的新冠开放知识图谱基础上,以新冠病毒为切入点悉心构造了一定规模的针对健康、医药、疾病防控等特定主旨的问答数据,参与者可以使用额外资源,但最终答案必须来自给定知识库,研究结果则是允许用户使用自然语言与知识图谱进行交互,比如接入智能音箱。
新冠知识图谱在应用层面,对于疫情防控与传染性流行病学研究都有重要的辅助意义。普通公众可以借此工具正确认识新冠肺炎的发病机制、防控措施、诊断治疗等,专业人士也可通过它能够获取到较为完善的数据信息,多维度了解业内公共资源。
在这个互联网信息爆炸、AI盛行的时代,知识图谱问答是十分有战略价值和研究意义的。一方面,传统搜索引擎是以网页资源为核心,依据关键词索引、文本匹配等方式进行检索并返回给用户相关网页链接,得到的答案总是鱼龙混杂,尤其是一些领域不够专业。另一方面,智能音箱、智能问诊等新一代AI产品应用,通常也需要依赖于特定的知识图谱响应用户的自然语言请求。而基于客观事实型,不包含主观因素的知识图谱,智能问诊应用可依据医药健康领域的知识库对患者的情况进行初步诊断。
AI 是新的生产力,知识图谱是 AI ﻪ进步的阶梯。针对病毒、防治、事态发展等主要场景的各类问答,妙健康参与的《新冠知识图谱构建与问答》任务发布后,能将包括开放领域和特定领域的若干知识库融合或链接在一起,从而形成既全面又深入的“超级”知识图谱,这样做不仅有利于疫情防控,也对疫后的研究分析可提供强有力的支持。
(任务样例说明)
CCKS每年都会面向公众发布评测任务,今年共设立8个相关主题评测任务,分别是:新冠知识图谱构建与问答、面向中文短文本的实体链指、面向中文电子病历的医疗实体及事件抽取、面向金融领域的小样本跨类迁移事件抽取、面向金融领域的篇章级事件主题与要素抽取、基于本体的金融知识图谱自动化构建技术评测、基于标题的大规模商品实体检索以及面向试验鉴定的命名实体识别。专委会为每个任务前三名设立奖金并颁发证书,针对不同任务特别评选“创新技术奖”,专门用于鼓励创新性技术。
值得一提的是,妙健康曾在疫情爆发的第一时间,与阿里云天池、阿里云达摩院机器智能语音实验室以及清华大学计算机系联合发起了“公益AI之星”挑战赛,要求参赛者利用AI对新冠疫情相似句对判定,达到优化智能问答系统的目的。该项目近期也已经进入评审环节,参与人数达到1092名,报名队伍940支,妙健康担任主要评委之一。
妙健康AI研发负责人常德杰表示,未来将继续秉持开放学习、协同创新的理念,积极响应国家和社会需求,进一步加快技术沉淀,把握相关学术、产业交流机会,与AI各界展开更广泛、更深入的探讨,拓展AI生态布局,为行业带来高效的技术解决方案。