A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 产经

科研工作者福音!巴西科学家研发新的NLP框架来自动提取论文数据

分享到:
 Chloe Ma • 2021-10-11 19:39:35 来源:前瞻网 E4650G0
100大行业全景图谱

1

巴西塞阿拉联邦大学最近发表的一篇论文预印本中提供了一个新的自然语言处理框架来自动化从科学数据中总结和提取核心数据。

对于科研工作者来说,日常工作中有相当大一部分的内容是通过搜索检阅相关论文,并摘取其中的有效信息。然而,阅读一篇论文并提炼中与自己研究工作相关的内容需要大量的精力,而阅读几十篇论文更是不易。在这项研究当中,研究团队提出了一种基于机器学习(ML)的自然语言处理(NLP)方法,能够自动识别并从文章的语料库中提取分类和数字参数。

该方法(命名为a.RIX)通过同时/互换使用ML模型,如神经元网络(NN)、潜在语义分析(LSA)、天真贝叶斯分类器(NBC)和使用正则表达式(REGEX)的模式识别模型来操作。

为了测试a.RIX引擎的效率,研究团队使用了一个由7,873篇涉及天然产品(NPs)的科学文章组成的语料库来进行测试。该引擎自动提取分类和数字参数,如(i)提取活性分子的植物种类,(ii)活性分子可以对付的微生物种类,以及(iii)对这些微生物的最小抑制浓度(MIC)值。这些参数的提取不需要语音标记(POS)和命名实体识别(NER)方法(即不需要文本注释),模型的训练是在无监督下进行的。这样一来,a.RIX基本上可以用于任何科学领域的文章。

前瞻经济学人APP资讯组

论文原文

https://arxiv.org/ftp/arxiv/papers/2107/2107.14638.pdf

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p7 q0 我要投稿

分享:

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J