当前位置:主页 > SEO优化 >

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

作者: 奕星SEO 分类: SEO优化 发布时间: 2019-08-16 00:51 内容来源:网络整理阅读量:

  原标题:287万篇CS文献数据分析:性别差距100年难消除,男女搭配协作更累

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  【新智元导读】近期,来自艾伦人工智能研究所的研究人员对计算机领域中的性别问题做了深入分析。实验表明,本世纪男性和女性作者数量将不会持平、不同性别作者之间协作率在下降。

  去年8月,名称一直饱受争议的国际顶会NIPS,因在会议中遇到的性骚扰,再次将NIPS推上风口浪尖。

  同年11月17日,NIPS官网将会议名称默默改为NeurIPS。至此,有关该顶会性别歧视、性别平等的问题算是得到了相应的解决。

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  这项研究对计算机领域近287万篇文献(截至2018年)进行了全面的分析,结果表明:

  研究人员通过对计算机科学会议和期刊(287万篇论文)中的文献原数据进行自动化研究,并利用Semantic Scholar学术搜索引擎中的数据来回答上述这些问题。

  作者列表从所有出版物中提取,并编译成一个名字列表。研究人员使用Gender API为每个名称执行性别查找。对于每个名称,Gender API输出预测的二进制性别(女性或男性),以及与预测相关的准确性和用于确定的样本数量。只有首字母可用的作者(少于语料库中所有作者的0.5%)被排除在分析之外。

  (性别应用程序接口(Gender API)是一个大型的在线数据库,通过将各国公开的政府数据与社交媒体资料链接起来,可以获得已知的姓名和性别关系。)

  但此时却存在一个问题:很多名字都是性别模糊的。因此研究人员使用Gender API返回的准确性来表示每个作者是男性和女性的复合。

  例如,第一个名字Matthew被确定为男性,准确率最高为100。这个结果是明确的。然而,Taylor这个名字被确定为女性的正确率仅为55分。

  精度用于为每个名称生成两个概率(m, f),其中m为关联作者为男性的概率,f为关联作者为女性的概率,其中m + f = 1。在本例中,每个姓Matthew的作者将用概率元组(1.0,0.0)表示,每个姓Taylor的作者将用概率元组(0.45,0.55)表示。

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  如上图所示,按照目前的增长速度,女性作者的比例预计在2137年左右达到0.45(95%置信区间:[2109,2172])。

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  上图显示了对均衡女性作者比例参数α的敏感性分析。该分析显示了在每个均衡比例中首次达到平等的年份。

  当均衡比例被认为有利于女性而非男性(高于0.5)时,达到平衡的年份会更早。即使女性最终将占所有出版物的90%,但按照目前的增长速度,预计到2100年左右将实现男女平等。

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  上图显示了自1995年以来相同/不同性别协作者的额外和缺失的数量。在男性和女性中,相同性别的合作作者比预期的要多,而不同性别的合作作者比预期的要少。近年来(与预期数字相比),每年有超过2万个不同性别的合作项目消失。

  虽然男性和女性都更有可能与自己性别的作者合作,但在女性作者中,同性偏好的程度正在下降,而在男性作者中却在上升。

  与此同时,不同性别之间的协作差距(O/E 1.0)也在不断扩大。尽管近年来有更多的跨性别合作机会(由于在该领域工作的女性科学家的增加),但观察到的跨性别合作的数量并没有如预期的那样增加。

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

287万篇CS文献数据分析:性别差距100年难消除男女搭配协作更累

  2002年Medline语料库数据中可以观察到不连续性。这是由于Medline索引记录中的完整作者姓名是从2002年才开始要求的。

  2002年这一比例的下降表明,Medline期刊没有对作者使用全名,才造成了2002年以前女性作者比例高的假象。

  研究人员对计算机科学文献(287万篇论文)进行了全面分析,以评估作者之间的性别趋势。

  根据最近的趋势,预计计算机科学中女性作者的比例在本世纪不会达到平等,并且在更现实的假设下,可能需要更长的时间。

  研究人员还观察到跨性别合作的数量低于预期,观察到的预期比率随着时间的推移而下降。


本文链接地址:http://www.seohuizhou.com/seoyouhua/1414.html
上一篇:<<贫困户有了二维码 农产品卖到大城市
下一篇:国家卫生健康委统计信息中心卫生统计分析与决策支持系统Ⅱ期>>