2020年4月14日 yobetvip官网博客, 学者, 政府, 图书管理员, 教师

TDM Studio今天上线。了解它是如何激发职业生涯的发现的

从预测CEO行为到理解莎士比亚的写作风格,ProQuest的新文本和数据挖掘解决方案帮助研究人员发现新的见解,挑战之前的发现。

今天,它发射TDM工作室,一种强大的新解决方案,将文本和数据挖掘的能力直接交到研究人员的手中。

TDM Studio为文本和数据挖掘(TDM)解锁了大量当前和历史的ProQuest内容,包括新闻、期刊、论文和论文、主要来源等。用户还可以上传自己的内容,并将其与ProQuest内容相结合,形成一个真正全面的数据集。

通过文本和数据挖掘发现新的连接

新的COVID-19数据集:ProQuest建立了一个包含50万篇与COVID-19有关的近期文章的数据集,其中大部分来自报纸。当TDM Studio进行分析时,这些数据可以帮助研究人员更好地理解当地和全国新闻报道的趋势。TDM Studio的任何用户都可以访问这些数据。注册一个演示。

约翰·狄龙TDM Studio的产品经理表示,他看到该产品为跨学科研究注入了新的活力。

“研究人员现在有了这些新方法来回答他们以前没有好的方法来回答的问题,”他说。“当你想起来的时候,这是令人兴奋的。多年来,许多研究人员都需要在适当的计算环境和执行TDM的分析工具中以机器可读的格式访问这些内容,但并不总是能够同时将所有这些元素放在一起。通过TDM Studio,我们能够解决这些挑战。”

在加入ProQuest之前,Dillon是其中一名研究人员。他拥有英国文学博士学位,在他的早期职业生涯中,他试图将有争议的或匿名的文本归为作者。他需要用到的很多统计方法都需要编程知识,所以他参加了编程和数据科学课程。之后,作为博士后,他在IBM Research工作,研究如何根据学生在在线学习平台上的评论和行动预测他们的情绪。

但是许多可以从TDM中获益的人并不擅长计算机或数据科学。这就是为什么TDM Studio是为所有技能水平的研究人员设计的。

Dillon说:“那些会编程的人可以使用预定义的数据分析方法,也可以使用R和Python等开源编程语言创建的自己的方法。”“在未来的版本中,非编码人员将能够使用嵌入分析方法的界面,引导用户可视化并部分操纵结果。”

随着产品的不断发展,其目标是在整个大学范围内提供TDM解决方案,而不管用户对TDM或编码有多熟悉。

该产品的灵活性还包括实时协作和“随时随地”访问。“在校园关闭、大多数研究人员都在远程工作的今天,这一点尤其重要,”他说明迪PozenelTDM工作室产品管理总监。“使用TDM Studio,他们可以与同事在项目上进行‘实时’协作,他们也可以在家中登录,而不用登录学校的网络。”

通过学院图书馆进行TDM

已经拥有丰富研究内容的学术图书馆可以使用TDM Studio从现有馆藏中挖掘更多价值,为与研究团队的合作和加强教学创造新的机会。

Pozenel说:“图书馆已经订阅了其中很大一部分内容。”“但即使你拥有一个被高度使用的数据库,也没有人能够阅读100万篇文章,巨大的价值仍有待挖掘。当你可以使用TDM从大量的这些内容中获取价值时,它就放大了图书馆作为服务中心的角色——传播知识并为研究工作流程创造更多价值。”

TDM工作室如何“拯救”了一位研究人员

虽然TDM Studio是市场上的新产品,但一些研究人员已经在使用它了。在过去的一年里,ProQuest与开发伙伴和早期访问研究人员合作进行了50多个不同的研究项目。

Rawson迦勒他是这些发展伙伴之一。罗森一直在从事一个研究项目,以确定CEO的信心如何有助于公司未来的成功。他试图弄明白,为什么一些公司领导人自信地谈论他们的商业秘密,而另一些则不然,以及这两种行为的后果。

罗森在接受ProQuest采访时表示:“例如,特斯拉首席执行官埃隆•马斯克喜欢谈论特斯拉正在做的一切。但是为什么呢?这让他的竞争对手有机会花更多的钱在竞争产品上。这就是我们所说的专有成本——披露你的商业秘密的成本,因为竞争对手现在知道你在做什么了。”

为了确定这种行为的结果,罗森需要对多年来的媒体报道进行广泛的分析:CEO简介、采访、特写、新闻和其他细节。但答案很可能只来自罗森做不到的事情:阅读成千上万的文章。于是他转向ProQuest和TDM Studio寻求帮助。

使用TDM Studio,学者们花在创建内容集上的时间减少到了几个小时,而传统方法需要几个月的时间。

Rawson表示,他在启动TDM试点项目时,向ProQuest提供了2,500对公司和ceo (特斯拉麝香,他想要发表的作品的清单,以及一系列的日期。他最初的搜索结果超过了32.3万,简单地说,“超出了我的预期,”他说。“如果没有必要,我不想花6个月的时间阅读成千上万篇关于ceo的文章。这就是TDM介入并拯救了我。”

Rawson使用TDM Studio采取了几个步骤来缩小他的数据集。首先,他删除了所有在广告中提到公司或CEO名字的文章。然后,他只保留包含某些短语的文章,比如自信,谨慎,乐观,悲观保守的。他继续使用额外的文本挖掘措施完善他的数据集,直到他写了大约2.2万篇文章。

“现在,在每一篇文章中,我都能使用一种算法,查看围绕CEO名字出现的、以自信或谨慎的方式描述他们的词语。TDM工作室为我节省了几个月的时间,我本可以花在收集和阅读文章上。”

最终,罗森了解到,过于自信的ceo会透露更多内幕信息和商业秘密。这可能会给竞争对手带来优势,同时也会妨碍自负的CEO所在公司的研究效率。这项研究目前正在等待同行评议。

罗森断言,会计研究并不像大多数人认为的那样乏味,他目前所做的只是揭示了可能性的冰山一角。Rawson说道:“我对TDM Studio感到非常兴奋。“我看到它在我正在做的研究中有很多应用。”

了解更多关于TDM Studio,包括如何将其应用于研究和教学。

新的COVID-19数据集

ProQuest建立了一个包含50万篇与COVID-19有关的近期文章的数据集,其中大部分来自报纸。当TDM Studio进行分析时,这些数据可以帮助研究人员更好地理解当地和全国新闻报道的趋势。TDM Studio的任何用户都可以访问这些数据。注册一个演示