|
在一些优选的实施例中,所述历史健康数据包括疾病史、历史病历、历史物联网数据。
在一些优选的实施例中,所述实时物联网数据包括实时的用户心率、血氧、血压、血脂、心电图、脑电图。
在一些优选的实施例中,所述用户问题理解模块包括以下单元:
用户问题输入单元,用于获取用户输入的语音和/或文字问题信息,并将语音问题信息转化为文字问题信息,获得预处理单元可以分析处理的文字问题信息;
预处理单元,用于进行用户问题输入单元输出的文字问题信息的分词、词性标注和句法类型分析的预处理;
词语层面分析单元,用于进行预处理后的信息的实体识别、共指消解和实体消歧;
语法层面分析单元,用于对词语层面分析单元输出的信息进行句法结构、词之间句法关系和短语之间句法关系分析;
语义层面分析单元,用于对语法层面分析单元输出的信息进行句子结构化和句子逻辑化,获得知识图谱查询语句。
在一些优选的实施例中,所述高效知识图谱模块包括以下单元:
知识库选择单元,用于选择结构化、半结构化和非结构化知识库并输入知识抽取单元;所述结构化知识库包括临床病例、医学文献和权威知识库;所述半结构化知识库包括生物医学数据库;所述非结构化知识库包括互联网数据库;
知识抽取单元,用于对结构化、半结构化和非结构化知识库进行属性抽取、事件抽取和实体与关联知识联合提取;
知识融合单元,用于对知识抽取单元输出的信息进行知识转换、提取知识因子后,根据融合方法和规则进行知识融合;
知识存储单元,用于将融合后的知识通过属性图、知识描述框架和三元组超图的方式进行存储,获得高效知识图谱。
在一些优选的实施例中,所述高效知识图谱模块还包括知识计算单元;
所述知识计算单元,用于对所述高效知识图谱的信息进行知识统计、知识图挖掘和知识推理后,进行所述高效知识图谱的更新,获得新的高效知识图谱。
在一些优选的实施例中,“实体与关联知识联合提取”,其方法为:
通过共享命名实体提取和关联知识提取的参数,构建基于神经网络的联合提取模型,并基于所述模型进行实体与关联知识联合提取。
在一些优选的实施例中,所述智能医疗服务模块包括以下单元:
个人健康数据管理单元,用于管理所述个人健康数据模块获取的用户个人健康数据;
健康监测单元,用于基于用户个人健康数据中用户背景信息、历史健康数据设定用户健康阈值,并在用户个人健康数据中实时物联网数据超过设定健康阈值时进行报警;
在线导诊单元,利用所述高效知识图谱对获取的用户病情信息进行知识推理,检索对应的医院,并结合医院数据库中医院信息、科室信息和医生信息,生成导诊建议;
辅助决策单元,基于构建的高效医疗知识图谱,结合用户个人健康数据,对用户进行疾病诊断,并生成药物、症状、疾病之间的关系以及药物禁忌和适应症状之间的关系作为辅助决策信息;
医疗知识问答单元,通过代数法、小波变换、贝叶斯估计、D-S推理法和神经网络中的一种或多种方法对用户个人健康数据进行数据融合,并利用大数据分析提取出疾病特征,结合知识推理,生成疾病预诊和预警信息;通过实体抽取、关系抽取、属性抽取和事件抽取,将个人健康数据转化为结构化数据,并通过机器学习与医疗知识图谱之间建立关系,生成问题信息的语音和/或文字应答信息。
本发明的有益效果:
(1)本发明基于数据和知识的个性化精准医疗问答系统,将智能穿戴设备、物联网医疗设备产生的物联网医疗数据与医疗问答系统进行结合,不仅对用户的医疗问题回答更准确,而且可以实现健康监测、在线导诊、辅助决策等功能,实现个性化精准医疗知识问答。
(2)本发明基于数据和知识的个性化精准医疗问答系统,对智能穿戴设备、物联网医疗设备产生的物联网医疗数据进行数据融合和大数据分析,建立疾病特征与物联网数据之间的关系,结合对患者可能疾病的临床表现智能问询结果和电子病历、体检报告等个人健康数据的大数据分析,进一步确定患者可能的疾病,解决传统智能穿戴设备、物联网医疗设备等只能进行健康指标异常指标警示,无法实现疾病在线诊断和健康监测的问题。
(3)本发明基于数据和知识的个性化精准医疗问答系统,根据患者个人健康数据实现疾病在线诊断,方便患者了解自己的病情,辅助用户及时、准确地就医治疗。此外,通过对病历数据进行大数据分析,挖掘出药品、病症、新疗效、副作用等之间的关系,为医生开具药品时提供参考;同时,通过患者物联网健康数据、电子病历、询问信息等,结合医疗知识图谱,构建基于信息特征的知识推理模型,进行健康评估和疾病智能诊断,在医生为患者诊疗过程中给予医护人员知识推荐、实时提醒与决策参考,使得普通医生也能够像资深医生一样为病人提供高质量的诊疗服务。
(4)本发明基于数据和知识的个性化精准医疗问答系统,收集患者的病史以及身体症状描述等信息,利用神经网络、自然语言处理、知识图谱等技术,构建在线导诊模型。结合患者个人健康数据、医疗知识问答以及医疗知识图谱,帮助患者快速找到对应的医生就诊,同时也为医生提供更加详细的诊断信息,节约了诊断时间,提高了诊断的准确性,提高患者就医效率,节约医院人力资源。
(5)本发明基于数据和知识的个性化精准医疗问答系统,个人健康数据主要用于管理个人健康数据,并为个性化精准医疗问答提供数据支持。用户可以通过语音、文字、视频、图像输入以及物联网上传的形式将个人健康数据存储在云端,支持个人健康数据查询和可视化展示。如果用户个人健康数据库中用户的信息不全面,会以询问的形式向用户提问有关的缺少信息,对用户的回答结果进行分析,提取出关键信息,完善用户个人健康数据库。
(6)本发明基于数据和知识的个性化精准医疗问答系统,由于现有医疗问答系统主要是通过文本进行问题输入,相应问题的答案也主要以文本的形式存在知识库中。然而,现实生活一部分人因文化程度、健康状况、年龄大小等无法输入文字形式的问题和阅读文字形式的问题答案,为此,设计语音识别模块和语音合成模块,分别将语音转化为文字和文字转化为语音,方便用户与问答系统进行交互。
(7)本发明基于数据和知识的个性化精准医疗问答系统,用户在进行医疗知识问答时,问答系统首先要准确理解用户所提问题。传统知识库问答方法面对单一领域有限规模知识图谱,多涉及的实体、概念、关系规模较小,通常采用模板、或者小规模机器学习算法进行语义解析。但是当面对大规模、多领域知识库时,随着实体、概念、关系规模增大,语义解析算法的复杂度也呈指数增加。为了能够准确理解用户的问题,利用深度神经网络将用户问题解析成为隐式表达的分布式数值向量的形式,其中蕴含的用户问句的关键语义,并在分布式表示过程中与知识图谱相关联,反映其中所蕴含的实体、关系等关键语义,实现用户问题的准确理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于数据和知识的个性化精准医疗问答系统的结构示意图;
图2是本发明基于数据和知识的个性化精准医疗问答系统一种实施例的用户问题理解模块的结构示意图;
图3是本发明基于数据和知识的个性化精准医疗问答系统一种实施例的高效知识图谱模块的结构示意图;
图4是本发明基于数据和知识的个性化精准医疗问答系统一种实施例的智能医疗服务模块的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据目标数据源的不同,现有的医疗问答系统可以分为三大类:检索式医疗问答系统、社区医疗问答系统和知识库医疗问答。检索式医疗问答系统,首先对用户提问的问句进行分析,将问句中的主题词与数据库中的关键词匹配,在数据库中查找可能包含正确答案的文本片段,数据库资源主要来自万维网、医学书籍、医学文献、临床案例以及在线医学网站的问答对等。检索式医疗问答系统仅仅局限于关键词匹配,匹配出的答案质量不是很理想,而且对于医学领域的特殊性,毫无保障的答案质量,难以满足用户的健康需求。社区医疗问答的核心问题是从大规模历史问答对数据中找出与用户提问问题语义相似的历史医疗问题并将其答案返回提问用户。由于医学信息规模庞大、数据源多元异构的特性以及医学专业的特殊性,在问答过程中,并不是所有医疗问题的答案都能通过在数据库中进行检索或查询就可以获取答案。主要原因是现有医疗数据库本身的覆盖度有限。检索式医疗问答系统和社区医疗问答系统尽管在某些特定领域或者商业领域有所应用,但是其核心还是关键词匹配和浅层语义分析技术,难以实现知识的深层逻辑推理,无法达到人工智能的高级目标。知识库医疗问答是给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库构建知识图谱,进行查询、知识推理获取隐含的问题答案。因此,目前医疗问答主要是基于知识图谱的问答,例如康夫子医疗大脑、百度医生、Watson Health等。现有医疗问答系统只能对用户的简单医疗知识(如病状、病理、注意事项等)进行答复,无法做到如患者身体健康状况评估与预警、远程诊疗、辅助医生决策等针对个人的深层次精准医疗问答,对医疗资源的充分利用和减轻医生负担非常有限。
本发明的一种基于数据和知识的个性化精准医疗问答系统,该系统包括以下模块:
个人健康数据模块,用于获取用户背景信息、历史健康数据和实时物联网数据作为用户个人健康数据,还用于以询问的形式获取用户的缺少信息,并对用户回答的信息进行分析和关键信息提取后作为用户个人健康数据的完善信息;所述用户个人健康数据以语音、文字、视频和图像中的一种或多种形式输入以及以物联网数据上传的形式输入;
用户问题理解模块,用于进行用户输入的问题信息的分词、词性标注和句法类型分析的预处理,并对预处理后的信息依次进行词语层面、句法层面和语义层面的分析,获得知识图谱查询语句;
高效知识图谱模块,用于获取结构化、半结构化和非结构化知识库,并依次进行知识抽取、知识融合、知识存储和知识计算,构建高效知识图谱;还用于结合用户个人健康数据以及知识图谱查询语句,在所述高效知识图谱中进行检索,获得问题信息对应的答案知识;
智能医疗服务模块,基于所述高效知识图谱模块发送的医疗知识图谱以及所述用户个人健康数据,通过语义匹配和知识推理进行用户健康数据管理、健康监测以及对用户的问题信息进行在线导诊、辅助决策和生成问题信息的应答信息。
为了更清晰地对本发明基于数据和知识的个性化精准医疗问答系统进行说明,下面结合图1对本发明实施例中各模块展开详述。
本发明第一实施例的基于数据和知识的个性化精准医疗问答系统,包括个人健康数据模块、用户问题理解模块、高效知识图谱模块和智能医疗服务模块,各模块详细描述如下:
个人健康数据模块,用于获取用户背景信息、历史健康数据和实时物联网数据作为用户个人健康数据,还用于以询问的形式获取用户的缺少信息,并对用户回答的信息进行分析和关键信息提取后作为用户个人健康数据的完善信息;所述用户个人健康数据以语音、文字、视频和图像中的一种或多种形式输入以及以物联网数据上传的形式输入。
用户背景信息包括用户姓名、性别、年龄、联系电话、家庭住址、教育程度;历史健康数据包括疾病史、历史病历、历史物联网数据;实时物联网数据包括实时的用户心率、血氧、血压、血脂、心电图、脑电图。
个人健康数据模块主要用于管理用户个人健康数据,并为个性化精准医疗问答提供数据支持。用户可以通过语音、文字、视频、图像输入以及物联网数据实时上传的形式将个人健康数据存储在云端,支持个人健康数据查询和可视化展示。如果用户个人健康数据库中用户的信息不全面,系统会以询问的形式向用户提问有关的缺少信息问题,对用户的回答结果进行分析,提取出关键信息,完善用户个人健康数据库。
本发明基于数据和知识的个性化精准医疗问答系统还包括语音识别模块和语音合成模块:语音识别模块,用于在用户选择语音输入时,进行用户输入语音的识别,获得对应的文本问题信息;语音合成模块,用于在用户选择语音输出时,进行应答信息的语音合成,获得对应的语音应答信息。
语音识别模块和语音合成模块,支持用户问题语音数入和文本输入方式以及系统以语音和文本形式答复用户问题,用户可以自由选择和切换。
用户问题理解模块,用于进行用户输入的语音和/或文字问题信息的分词、词性标注和句法类型分析的预处理,并对预处理后的信息依次进行词语层面、句法层面和语义层面的分析,获得知识图谱查询语句。
如图2所示,为本发明基于数据和知识的个性化精准医疗问答系统一种实施例的用户问题理解模块的结构示意图,用户问题理解模块包括以下单元:
用户问题输入单元,用于获取用户输入的语音和/或文字问题信息,并将语音问题信息转化为文字问题信息,获得预处理单元可以分析处理的文字问题信息;用户问题输入主要是通过语音和文字两种方式,系统答复用户问题的形式主要是通过文字和语音。通过语音识别模块将用户语音形式的问题转化为文字,语音合成模块将系统的结果答复转为语音,便于用户与系统就行交互;
预处理单元,用于进行用户问题输入单元输出的文字问题信息的分词、词性标注和句法类型分析的预处理;
为能够准确理解用户的问题,本系统将从词语、句法和语义三个层面实现用户句子理解:
词语层面分析单元,用于进行预处理后的信息的实体识别、共指消解和实体消歧;在词语层面,通过基于统计机器学习的方法进行命名实体识别,将词、词典、规则、上下文等信息等作为特征,利用机器学习的监督算法(支持向量机、隐马尔科夫模型、条件随机场等),训练实体抽取模型;基于聚类的统计共指消解方法,将候选的名词短语表示成特征向量,利用特征衡量候选名词短语共指的可能性,基于候选名词短语之间的共指可能性对它们进行聚类;基于多方向注意力机制的实体消歧模型,通过在深度神经网络中引入intra-attention层和inter-attention层,提高模型在复杂上下文环境下的鲁棒性和对高歧义性指称的消歧能力;
语法层面分析单元,用于对词语层面分析单元输出的信息进行句法结构、词之间句法关系和短语之间句法关系分析;在句法层面,通过深度学习的对句子的关系进行分析,将词向量将句子表示成了矩阵,再利用卷积神经网络和maxpooling得到句子的向量表示,并用softmax分类器对该向量进行分类,得到句子的关系类别;
语义层面分析单元,用于对语法层面分析单元输出的信息进行句子结构化和句子逻辑化,获得知识图谱查询语句;在语义层面,根据词语层面、句法层面的分析结果,将自然语言问句解析成可计算、结构化的逻辑表达形式;将句子结构化为知识图谱查询语句,在知识库中检索,匹配出实体和关系与问题语义相关性高的实体,同时将相关实体按重要性排序返回给用户。
高效知识图谱模块,用于获取结构化、半结构化和非结构化知识库,并依次进行知识抽取、知识融合、知识存储和知识计算,构建高效知识图谱;还用于结合用户个人健康数据以及知识图谱查询语句,在所述高效知识图谱中进行检索,获得问题信息对应的答案知识。
如图3所示,为本发明基于数据和知识的个性化精准医疗问答系统一种实施例的高效知识图谱模块的结构示意图,高效知识图谱模块包括以下单元:
知识库选择单元,用于选择结构化、半结构化和非结构化知识库并输入知识抽取单元;所述结构化知识库包括临床病例、医学文献和权威知识库;所述半结构化知识库包括生物医学数据库;所述非结构化知识库包括互联网数据库;
知识抽取单元,用于对结构化、半结构化和非结构化知识库进行属性抽取、事件抽取和实体与关联知识联合提取;针对传统的串行知识提取方式中,实体提取和关联知识提取分别进行,导致关联知识提取的结果受限于实体提取结果的问题,提出实体与关联知识联合方法,其通过共享命名实体提取和关联知识提取的参数,构建基于神经网络的联合提取模型,实现实体与关联知识联合提取;
知识融合单元,用于对知识抽取单元输出的信息进行知识转换、提取知识因子后,根据融合方法和规则进行知识融合;针对多源异构数据,建立知识融合规则,对抽取的知识进行转换,获得隐藏在数据源中的知识因子,并根据融合算法和融合规则实现知识融合;
知识存储单元,用于将融合后的知识通过属性图、知识描述框架和三元组超图的方式进行存储,获得高效知识图谱;为了提高知识图谱的管理和计算效率,通过基于图结构的知识图谱存储方式,主要利用属性图、知识描述框架和三元组超图的三种图模型。
提高知识图谱的质量、知识的完备性和扩大知识的覆盖范围,高效知识图谱模块还包括知识计算单元,对所述高效知识图谱的信息进行知识统计、知识图挖掘和知识推理后,实现知识快速查询、知识预测、关系和信息快速推理等,并进行高效知识图谱的更新,获得新的高效知识图谱。
智能医疗服务模块,基于所述高效知识图谱模块构建的医疗知识图谱以及所述用户个人健康数据,通过语义匹配和知识推理进行用户健康数据管理、健康监测以及对用户的问题信息进行在线导诊、辅助决策和生成问题信息的语音和/或文字应答信息。
如图4所示,为本发明基于数据和知识的个性化精准医疗问答系统一种实施例的智能医疗服务模块的结构示意图,智能医疗服务模块包括以下单元:
个人健康数据管理单元,用于管理所述个人健康数据模块获取的用户个人健康数据;
健康监测单元,用于基于用户个人健康数据中用户背景信息、历史健康数据设定用户健康阈值,并在用户个人健康数据中实时物联网数据超过设定健康阈值时进行报警;
对智能穿戴设备、物联网医疗设备产生的物联网医疗数据进行数据融合和大数据分析,建立疾病特征与物联网数据之间的关系,结合对患者可能疾病的临床表现智能问询结果和电子病历、体检报告等个人健康数据的大数据分析,确定患者可能的疾病,解决传统智能穿戴设备、物联网医疗设备等只能进行异常指标警示,无法实现疾病在线诊断和健康监测的问题;
在线导诊单元,利用所述高效知识图谱对获取的用户病情信息进行知识推理,检索对应的医院,并结合医院数据库中医院信息、科室信息和医生信息,生成导诊建议;
在线导诊将疾病在线诊断、健康监测结果、主观的自我感觉描述和医疗知识图谱相结合,确定治疗用户疾病的科室,在线指导用户到医院相应科室治疗疾病,避免用户因缺乏医疗知识,无法准确挂号的问题,减轻医院医护人员的负担;
辅助决策单元,基于构建的高效医疗知识图谱,结合用户个人健康数据,对用户进行疾病诊断,并生成药物、症状、疾病之间的关系以及药物禁忌和适应症状之间的关系作为辅助决策信息;
医疗知识问答单元,通过代数法、小波变换、贝叶斯估计、D-S推理法和神经网络中的一种或多种方法对用户个人健康数据进行数据融合,并利用大数据分析提取出疾病特征,结合知识推理,生成疾病预诊和预警信息;通过实体抽取、关系抽取、属性抽取和事件抽取,将个人健康数据转化为结构化数据,并通过机器学习与医疗知识图谱之间建立关系,生成问题信息的语音和/或文字应答信息;
医疗知识问答将用户背景信息、历史健康数据以及智能穿戴设备、物联网医疗设备产生的物联网医疗数据与医疗问答系统进行结合,利用医疗知识图谱构建健康评测模型,对用户的健康状况进行实时监测,依据健康评测结果指导可能患有疾病的用户到相应科室进行就医治疗,并可以为医生提供知识推荐、实时提醒、决策参考等,不仅可以实现常规医疗知识问答,而且可以实现健康监测、在线预诊、辅助决策、就医指导等针对个人的深层次精准医疗问答。
本发明把传统的基于历史数据的问答系统和实时的物联网数据相结合,扩展了针对个人的精确问答,进而延伸了一些应用场景,比如辅助决策、健康诊断、疾病预警等。
需要说明的是,上述实施例提供的基于数据和知识的个性化精准医疗问答系统及方法,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。 |
|