别让“码农”再当无名英雄,编程怎么编软件

软件 5
主编:赵路编辑:冯丽妃校对:王心怡E-mail押lzhao@ 国际 INTERNATIONAL 3 2016年1月13日星期三Tel:(010)62580617 别让“码农”再当无名英雄 美网站尝试跟踪计算机编码影响力鼓励软件创新 科学线人 全球科技政策新闻与解析 讽刺论文聚焦循证医学偏颇 KlausSchliep是美国波士顿马萨诸塞大学的一名进化生物学博士后,他的谷歌学术网页上列举了其作为作者发表的文章,包括他引用率最高的一篇文章,该文章描述了一种叫作“phangorn”的系统发生学软件,但却并未提及他在该软件中作出的贡献。
“和写作论文相比,编码被认为是科学领域的‘二等工作’。
”Schliep说。
现在Depsy来了,这是一家在2015年11月成立的自由网站,其目的是“评估推动科学发展的软件的价值”。
Schliep在该网站上的简历表明,他对7个软件包有贡献,并且对“phangorn”软件拥有34%的荣誉贡献。
这些包裹总体下载次数超过2600次,曾被89篇开放获取的研究论文引用,并且其他软件也曾多次利用过这些软件包,这使Schliep在该网站所有编码员的影响力排名中位居第99百分位。
Depsy的创始人希望这个平台可以提供一种透明、有意义的渠道,用来跟踪学术界研发的软件的影响力。
该平台背后利用的技术是由加拿大温哥华一家非盈利企业“影响力故事”研发的,该技术始于4年前,旨在帮助科学家跟踪其在线成果的影响力。
其跟踪对象不仅包括文章,还有博客、数据集以及软件等,并通过诸如推特网转载量、查阅量、下载量、代码再利用以及日常引用量等不同指标进行影响力评估。
实际上,Depsy已经意识到了科学软件背后隐藏的“无名英雄”,“影响力故事”创始人JasonPriem说,该机构由美国国家科学基金会和各种慈善机构资助。
当前,迫切需要这样的工具,英国爱丁堡软件可持续性研究所创始人NeilChueHong强调说,现在的年轻科研人员对编码拥有热情,但目前根据软件对科研人员进行评价的渠道却寥寥无几。
去年,他对1000名随机选择的英国科学家进行了调查,结果表明超过50%的研究人员会自己动手制作编码。
尽管如此,在英国最新研究质量审计中,很少有科学机构把编码或软件纳入科研人员的研究成果。
即便在严重依赖软件的计算机科学领域,情况也是如此。
“这种文化造成了一种印象,制作编码及发表相关论文不会给研究人员带来利益。
”Hong说。
跟踪软件使用 跟踪学术影响力的常规方式是统计引用量,这和软件有一些关联。
研究人员可以写文章描述他们的软件,就像Schliep在phangorn软件包上所做的那样,因为任何使用该程序的人都会在随后的文章中引用他的成果。
但统计引用量作为一种评估标准却存在缺陷。
研究人员可能并不知道会引用哪篇论文,Priem争论说,因为一个软件包经常与多篇文章相关联,而一些重要的软件项目,比如GDALPython图书馆项目,和规范化论文并无关联。
如果软件没有相关联的文章就没有普遍认可的引用它的方式。
现在,编码员在其编码以及数据集上分配数字对象标识符(DOIs)非常普遍,德国汉诺威市在线数据库———数据引用技术主任MartinFenner强调说。
软件一开始经常被储备在常用的编码储存库GitHub中,在那里 “这种文化造成了一种印象,制作编码及发表相关论文不会给研究人员带来利益。
TheProjectTwins制图 可以通过Zenodo或Figshare等集中学术数据库自动归档,它们把DOIs分配给软件,从而使其成为可以引用的对象。
其他做法也在试图保证让研究论文在引用软件时可以有标准的方法,比如通过使用研究资源标识符等。
但是通过统计软件DOIs和文章的引用量,或是通过其他标准方式,并不能揭示编码者对科学的影响力,因为很多软件经常不会被引用。
2015年对90篇随机挑选的生物学论文进行研究后发现,有2/3的论文非正式地提到使用了软件,但是其中引用相关软件包的文章实际上不足一半。
Depsy搜索了研究论文,以此寻找引用以及非正式提及软件使用的情况,结果不出意料地发现,在文章致谢部分或是在学术论文的主体部分,提到使用了很多软件。
但是Priem承认,该网站也有局限性,即目前它只能搜索开放论文,错过了大量的付费阅读学术论文。
然而,“影响力故事”计划和出版商谈判,以便获取许可,可以挖掘付费论文文献中的软件使用情况。
Priem表示,在论文中提名只是Depsy网站跟踪软件影响力的3种方法之
一。
该网站的第二种方法是,跟踪编码如何被其他人再次利用。
Depsy的名字来源于“相关性网络”,是一个表示各种因素相互依存的词汇。
Depsy通过谷歌的PageRank算法,计算了编码的重新利用率,从而可以评价出哪些编码更加出色。
从监测影响力的角度看,编码的重新利用可能比其在文献中的引用率更有意义,Priem说。
该网站的第三种方法是,通过梳理CRAN和PyP(I以普遍使用的R和Python编程语言编 写的软件的两大储存库),收集编码包裹的下载量数据信息。
聚焦科学研究 其他的网站也会提供一部分Depsy可以提供的服务。
例如,Crantastic是一个评论网站,它可以跟踪最受欢迎的R软件包裹;PyPI排行榜通过跟踪该网站的软件下载量,排列了最受欢迎的Python模块。
此外,一些商业服务网站,如VersionEye和Libraries.io可以跟踪相关性网络,解释哪些软件依存于其他哪些软件包。
但与众不同的是,Depsy平台可以通过识别关键词、文本描述以及软件名称,聚焦研究类软件。
尽管分类过程现在仍存在缺点,Priem说。
该平台也会跟踪其他编码,但是在计算百分位影响学术排名时,它只包括研究型软件。
Depsy会通过统计一个软件包中参与者的贡献或编辑(即个人贡献)所占的百分比,向其分配零散的信誉度。
每项贡献的足迹都会保存在编码中,使其很容易跟踪到软件包发起人。
但是并非每次编辑都会得到同样的影响力,目前,Depsy仍不能区分重要贡献者和贡献较少的人。
未来仍然需要对它进一步改善,从而可以跟踪个人贡献的影响力,Priem说。
Depsy还让用户决定在具体学科领域拥有最高影响力的软件。
例如,在该平台搜索“天文物理学”,会出现11个软件包,其中一个叫作“yt”的天文物理学分析与视觉模拟软件拥有最高的影响力,在所有软件包中,它处于第97个百分位。
发展中的障碍 Hong指出,Depsy的一个限制因素是它只 能跟踪公共论文库中的编码,因此不能展示商 业软件的影响力。
此外,该网站仅仅跟踪R和 Python等两种编程语言制作的软件。
但是Depsy的创建人最终希望可以把其他 编程语言也包括在内,并且增加评估软件包影响 力的第4种方法:把社会影响力标准纳入考量,比 如软件包从其他GitHub用户那里得到多少颗 星,以及一个软件被在线讨论了多少次等。
该网站的编码再利用标准也有其他不足之 处。
研究人员经常会再次利用他们自己的代码, 就像研究论文作者“自引”一样,如此一来,Dep- sy
可能会被重复“愚弄”,从而让原创者得到更 高的分数。
Fenner警告说,一些研究人员还可能 通过另一种方式愚弄该网站,即启动许多软件 项目,但是都不去完成它们,而是等着别人来改 进与完成;而在软件成功后,该项目发起人可能 会揽获荣誉。
“我倒是希望看见人们试图‘戏弄’Depsy, 因为这意味着他们对软件再利用足够重视。
” Priem
说。
最终,证明代码影响力的透明标准可能会 让软件研发者在资金评估时获得更多资助,这 是Hong的希望。
他表示,科学领域的“码农”应 该拥有更多资助和支持,但是做到这一点需要 改变现有文化,需要科学研究领域的每个人参 与进来。
“最大的讽刺是,如果不对制作这些软 件的人作出鼓励,我们实际上是在给科学发展 设置障碍。
”Hong
说。
(红枫) 有关母亲亲吻孩子伤口的一篇恶搞论文引起了社交媒体的注意。
图片来源:HaroldLeeMiller 一项显示母亲的吻并不能帮助受伤的儿童 感觉更好的讽刺性研究包含了若干条伪造的线 索。
该研究资助者是一家杜撰的普洛克特和约翰 逊医学公司,其中一项参考文献的名字是“这里 到底发生了什么?”这篇文章描述了一项母亲亲 吻孩子的虚构随机对照试验(RCT),其设计目的 是解释循证医学的局限性,因为这门学科经常利 用来自类似临床试验的数据指导医学实践。
很多人在推特网上分享了这篇文章。
美国北 卡
罗来纳州立大学医学院泌尿科医生Angela Smith留言说:“在RCT中,母亲的亲吻明显不能 有效缓解创伤,我们家把它变成了‘吹一吹伤 口’。
” 但是一些人评论说,《临床实践评估期刊》编 辑在发表这篇文章时,应该明确地贴上“讽刺论 文”的标签,以防产生误导。
RCT被广泛认为是循证医学的“金科玉律”。
但是近年来一些医生和研究人员反对过于强调 RCT,并争论称类似的研究会弱化实例证据和职 业经验,他们认为后者并不比从临床试验中获得 的证据差。
为了指出一些循证医学存在的缺陷,西雅图 华
盛顿大学医学中心医生和研究人员Mark Tonelli进行了一项临床试验,以验证母亲亲吻孩 子的伤口是否有助于抑制疼痛。
他的做法是受到 10年前初为人父时的启发。
“我们是一个习惯亲 吻伤口的家庭。
”Tonelli说。
他的文章署名作者是一个虚构的叫作母亲 和孩子亲吻(SMACK)的研究团队,研究表明在 943对母亲—儿童组中,经过亲吻的儿童实际上 比那些没有被亲吻的儿童“更加抑郁”。
作者在总 结中建议,暂停亲吻伤口。
通过这篇文章,Tonelli旨在批评RCT,尤其 是医务人员为此忽视了人与人之间的交流,而这 才是医学的基石。
Tonelli希望,医学实习生们能 够通过这篇论文,“激励自己在真正的研究报告 中发现类似的问题”。
(红枫) 美科学机构设奖鼓励透明研究 眼见为实有多“实” 研究指出目击证人自信度应被纳入证据 1984年7月,一名男性闯入美国北卡罗来纳州22岁女孩JenniferThompson的公寓,并且用刀威胁她。
Thompson同他谈判,说服其不要杀掉自己。
最终,他强奸了Thompson并且逃走。
仅仅数小时后,一位素描艺术家同Thompson合作,创建了这名袭击者的脸部画像。
随后,警察向她展示了一系列有着类似外貌的男性的面部照片。
Thompson挑出了22岁的RonaldCotton。
因年轻时犯下抢劫罪,Cotton的照片被存档。
当知道警察正在找自己时,Cotton选择了自首。
基于Thompson的证词,Cotton被判终身监禁。
11年后,随着DNA测序技术的兴起,从Thomson体内采集的样本同另一名最终认罪的男性相匹配。
Cotton被释放。
当Thompson通过照片第一次辨认出Cotton时,她并不确信自己的选择。
“我觉得这就是那个人。
”Thompson在几分钟的犹豫后告诉警察。
随着时间的流逝,她变得更加肯定。
到1年后Thompson在法庭上面对着Cotton时,她的疑虑完全消失了。
她自信地将Cotton指认为强奸她的那名男性。
由于像这样的案例不断出现,美国司法系统一直在改变目击者参与刑事案件的方式。
陪审团被告知要对目击者证词的价值持怀疑态度,并且无视目击者对于他们认为自己看到的人可能表现出来的自信。
如今,一项关于抢劫案调查的最新研究表明,这些改变可能弊大于利。
没有人怀疑目击证人的证据带有风险性。
自上世纪90年代以来,美国上百名无辜的人因DNA证据被免除罪责,同时在70%的案件中,目击证人的错误指证是根本原因。
为解决该问题,研究人员开展了试验,即让演员演完一起案 自信的目击证人并不一定准确,但一项对抢劫案件进行的研究发现,这取决于在评估出他们的自信 度之前已过去了多长时间。
图片来源:KatarzynaBialasiewicz/iStockphoto 件,然后让受试者试图从一组人中正确地辨认
出犯罪者。
研究表明,目击证人能非常轻易地被自信的虚假回忆愚弄,同时连续向他们展示照片会减少错误指证。
不过,很多研究人员表达了这样一种担忧:这些实验室试验能否精确地反映现实世界的情形。
为此,由加州大学圣地亚哥分校心理学家JohnWixted领导的团队同得克萨斯州休斯顿警局抢劫案小组联合开展了一项试验。
他们聚焦了2013年发生的348起抢劫案,并且让目击证人和 一名嫌疑犯参与进来。
为确保警察不会无意识地影响整个过程,并不知晓谁是真正嫌疑犯的警官向目击证人展示了6个人的照片。
当目击证人作出决定时,他们还会利用三点量表(高、中、低)记下这些目击者对自己的选择有多自信。
每起案件还拥有一定数量的补强证据,从弱(已知嫌疑犯靠近犯罪现场)到强(嫌疑犯的鞋子同现场的脚印相匹配)不等。
如果自信真的是准确性的一个强烈信号,研究人员推断,对自己的选择更加肯定的目击证人应当更有可能辨 认出有着大量补强证据的嫌疑犯,同时对自己 的猜测存疑的目击证人应当没有那么准确。
确实,这便是研究发现的结果。
总体上,目击 证人在约三分之一的时间里指出了嫌疑犯,在
分之一的时间里把用于填充照片阵容的
5名无辜 群众中的一位指认为嫌疑犯,并且在三分之一的 时间里判断出犯罪者不在这组照片中。
不过,在将 目击证人的自信度纳入进来后,一幅不同的画面 呈现出来。
高度自信的目击者在约75%的时候指 出了嫌疑犯,在低于20%的时候错误地指控了
5 名无辜群众中的一位。
当警察拥有针对嫌疑犯的 足够补强证据时,自信的目击证人作出正确指控 的概率蹿升至90%。
研究人员日前在美国《国家科 学院院刊》网络版上报告了这一成果。
Wixted表示,该结果并不意味着目击证人 不会受到自信的虚假回忆的影响,但时间选择 非常关键。
“我们想表达的重点是,你不得不注 意到目击证人在初始指认时表现出来的自信。
” 一旦目击证人到了法庭上作证,虚假回忆可能 已变得固化。
他还介绍说,在
DNA证据使被误判的人最 终免除罪责的大部分案件中,初始的目击证人 辨认是在比较低的自信度下进行的。
如果自信 得分被纳入到证据中,不仅得到指控的无辜者 可能变少,更多的罪犯也有可能被判罪。

利诺伊大学香槟分校心理学家Aaron Benjamin表示,该结果言之有理,因为忽视目击 证人的自信度“同被广泛接受的关于记忆的观 点极其不相符”。
司法体系应当重新考虑如何利 用目击者的证词,因为“这里面存在很多风险”。
法庭可能“会让更多的罪犯留在街头,而让更多 无辜的人身陷囹圄”。
(宗华) 开放科学中心的成员在讨论如何奖励科学家
为透明研究所作的贡献。
图片来源:BILLYHUNT 心理学家BrianNosek相信,再现性是科学 研究的一个核心原则。
为了推行这一观点,他在 2013年参与共同创建了一个非营利组织,可以让 科学家在进行实验之前,先描述他们的实验想 法。
近日,Nosek合作创建的开放科学中心(COS) 在此基础上又推进了一步,为每一位预先注册其 拟定研究的科学家提供1000美元的奖金。
美国弗吉尼亚大学教授Nosek说,该奖金 旨在抛砖引玉,使科学研究拥有更大的透明度 和责任感。
“预先注册会通过提前证实需要分析和报 告的那些内容,增加检验假设的可靠性。
”该中 心网站写道。
提倡预先注册的人表示,这同时也 会减少“档案柜研究”的数量,出现这种研究主 要是因为得到的是负面结果,科学家不愿意发 表任何内容。
这是一项名额有限的奖励。
只有1000名科 学家能够收到这笔钱,一旦他们达到所有要求, 这笔资金就对立刻兑现。
相关研究必须出现在
家同意采取该中心倡议的开放科学原则的期刊 上,在文章被接受之前,科学家收不到一分钱。
已 有若干领域的
460家期刊认可该中心的原则,目 前,COS仍在社会学、行为学以及经济学等领域 寻求更广泛的合作伙伴。
大多数运行临床试验的 研究人员已经依据要求,在政府网站进行了预先 注册。
该中心项目经理DavidMellor说,新的奖项 并不打算支持任何一项研究,而是旨在作为COS 的一个市场工具,让研究人员愿意尝试新事物。
奖励资金来源于劳拉和约翰·阿诺德基金会捐赠 的120万美元。
(鲁捷)

标签: #文件夹 #程序 #苹果 #压缩文件 #怎么做 #好友 #程序 #文件