国际3,数据分析员是做什么的

做什么 3
2017年7月6日星期四Tel:(010)62580617 主编:赵路编辑:闫洁校对:何工劳E-mail押lzhao@ INTERNATIONAL国际
3 用数学拯救民主 科学家尝试用算式让选举更具代表性 科学线人 全球科技政策新闻与解析 德国波兰合建卓越中心 背靠在椅子上,JonathanMattingly把双腿搭在桌子上,他按下了笔记本上的一个按键,改变了美国北卡罗莱纳州2012年的选举结果。
在显示屏上,闪烁的线条和点概括了该州13个国会选区的地图,每个区都会选择一人派往美国众议院。
通过调整那些选区的边界,但不改变每张选票,Mattingly的地图显示民主党的候选人在竞选中赢得6个、7个,甚至是8个席位。
但实际上,尽管他们整体上获得了数量更多的投票,但他们仅赢得了4个席位。
Mattingly的选举模拟不能重写历史,但他希望它们将有助于在未来在他所处的州乃至整个国家支撑民主。
北卡罗莱纳州杜克大学的这位数学家设计了一个算式,可以生成该州选举地图的随机选择版本———到目前为止他已经建立了超过2.4万个,以此尝试量化不公正的选区重新划分———选区被吸引支持或不支持某位特定候选人或政党———的范围和影响。
选区不公正的重新划分在美国有着漫长而不受欢迎的历史。
因此,在由澳大利亚悉尼大学和美国哈佛大学肯尼迪政府学院的合作项目———“选举完整项目”做出的2017年选举公平指数中,美国在158个国家中位居第55位,在西方国家中位居最末。
尽管重新划分选区在2016年骚动的总统选举中并未发挥作用,但它似乎影响了当年谁赢得美国众议院的席位。
“即便重新划分选区会影响435席中的5个席位,它已足以动摇关键的投票。
”Mattingly说。
他和若干名其他数学家希望改变这一点。
在过去5年中,他们拓展了算式和计算机模型,以揭示选区边界中存在的偏见。
现在,他们的声音开始被聆听。
划分边界线 1812年,马萨诸塞州州长ElbridgeGerry签署法案重新划分一些选区从而让他所在的党派受益。
一个像火蜥蜴一样的非常奇怪的区域环绕着波士顿市,政治讽刺人士戏谑这个新区域为“Gerry-mander”,意指“对选区进行的不公正的重新划分”。
从那时起,随着州议员用迂回曲折的创造力重划选区,这一策略已经成为美国政治家的一个主要产品。
然而,最高法院在历史上并未对此予以干预,各个主要选区遵从4个标准:它们是连续性的;它们是紧凑的;它们含有人数大致相同的人;它们按照1965年《选举法案》的规定给少数族裔机会选举其代表。
作为统计和概率方面的专家,Mattingly对政治选举过程的兴趣使他在2013年参加了一次公众会议,他在那里听到一名演讲人抱怨北卡罗莱纳州2012年的选举结果。
近10年来,该州的13个选区有着较为对等的选举结果。
有时,民主党占6个席位,有时则是7个。
但在2012年选举之前,共和党重划了选区,将民主党人打包在3个选区之内,使该党处于严重不利地位。
尽管其候选人赢得50.3%的选票,但该 在美国,围绕选区精确界线的法律战役很常见。
图片来源:JayBaker 党仅仅获得了4个席位。
Mattingly被那人激昂演说的激情鼓舞,但 也被这一事实迷惑。
“如果它的确不公平,应该有一种在数学上显示它的方法。
”他说,“我想要超过‘他说或她说’,建立更加客观的评估方法。
”了解该问题之后,他认为自己有机会创建法官一直在寻找的标准。
公正性测量 重划选区的两种主要方式———包围和分割已经形成一些干扰迹象:反对党倾向于通过在被包围区域以压倒性优势获胜,但在分割区域以细微的落差失败。
重新划分的选区可能是在地理上伸展开来且轮廓不同寻常。
Mattingly和一名学生ChristyGraves一起,将这些对策融入一个量化性的北卡罗莱纳重划选区指数中。
两人从该州2012年选区和被临近地区打断的公共数据开始,他们随后对选区的边界做了数千次细微的改变,从而反复验证以满足最高法院的4个标准。
通过数千份地图及其形成的选举结果,Mattingly和Graves开始分析北卡罗莱纳州选区重新划分的程度如何。
他们对其他州的数据分析也揭示了马里兰州党派产生的选区不公正的重新划分,该州民 主党控制的立法者在排挤其保守党竞争对手。
而在诸如亚利桑那州和爱荷华州,由于有独立的或是两党之间的委员会监督选区划分,情况则要好得多。
在一项独立分析中,宾夕法尼亚州技术公司Azavea的地理信息系统数据分析师DanielMcGlone对各州的选区紧凑性进行了排序,以此作为选区不公正划分的措施,该分析发现马里兰州是最不公正的重新划分选区的州,北卡罗莱纳州位居第
二。
而内华达州、内布拉斯加州和印第安纳州出现不公正选区重新划分的程度最低。
可预见的解决方法 在2016年夏季,一个由两党退休法官组成的委员会碰面了解他们是否可以为北卡罗莱纳州设立一个更具代表性的选区,他们的地图给Mattingly提供机会测试其指数。
他发现,法官设置的选区比计算机生成的重新划分选区的不公正性低75%,这表明了那是一个绘制较好的具有代表性的地图。
通过对比,Mattingly、Graves和同事在今年4月报告称,计算机绘制的2.4万多个选区中每个选区均比各州立法者绘制的选区更加公正。
“这正是我希望得到牵引的结果。
”Mattingly说,“它表明选区结果的确不能代表人民的意 愿。
”当华盛顿特区民主倡导组织的相关人士看 到这项研究后,他们邀请Mattingly担任北卡罗 莱纳州今年夏季即将到来的为政党利益而改变 选举区的专家见证人。
然而,对于研究人员和法 官来说,问题是Mattingly的方法是否最好。
美国立法者不愿意拥护改变不公正选举区 划分的数学解决方案。
华盛顿特区依法公民权 利律师委员会社会学家MeganGall表示,但目 前法庭案件表明相关压力在逐渐加大。
如果法官愿意接受选区划分公正性的数学 检验,他们将需要像Mattingly一样的专家见证 人解释这些检验如何运行以及为什么能够发挥 作用。
然而,该国研究这一问题的数学家人数过 少,不足以解决该国悬而未决的法律诉讼。
为 此,马萨诸塞州塔夫斯大学数学家Moon Duchin正在组织一个为期一周的夏令营,帮助 数学家了解各种改变选举区的模型的微妙之处 以及如何应用和解释它们。
Duchin希望有50 人可以报名,不过已经有超过1000人做了申 请。
“这一回应把我们的原计划打乱了。
”她说, “现在我们打算开启若干个营地”。
Mattingly和他的模型今年夏季将走进法 庭。
即便他的算式不能成为标准,Mattingly也希 望司法系统能够阻止为一党私利而重新划分选 区,重新恢复人们对选举系统的信任。
“我也是 一名公民。
”他说。
(晋楠编译) 位于波兰北部城市格丁尼亚的波美拉尼亚科技园,是在欧盟联合资助项目的框架下获益的诸多中心之
一。
图片来源:MichalFludra/AlamyLiveNews 在一项为欧盟内东欧和西欧国家的研究合作提供新蓝图的框架计划中,德国和波兰将共同资助顶级科学家在波兰的科研机构中创建研究小组。
7月4日,两国宣布了“狄俄斯库里计划”———以描述神话中的孪生兄弟卡斯特与帕勒克的古希腊单词命名。
该项目将在未来10年为10名科学家每人提供300万欧元(合340万美元),以建立其在波兰的卓越中心。
此项计划旨在提高欧盟中科学欠发达地区的学术实力,并且由德国马普学会监管。
该学会主席MartinStratmann表示,如果获得成功,它将被扩展到附近的欧盟国家。
马普学会已同这个欧盟中最大的东欧国家建立了联系:有两个研究小组在波兰设点,但它们全部由荷兰资助。
相比之下,新的卓越中心将从德国获得一半资助。
波兰资助科研的政府机构———国家科学中心将管理这些中心,马普学会则将监管一个国际委员会以选择脱颖而出的科学家。
申请要求将在11月公布。
该项目仿照了马普学会的“密涅瓦计划”。
尽管两者有着不同的历史根源,后者通过类似方式已为以色列的科研提供了50多年的支持。
“密涅瓦计划”原本的目的是为二战后的两国建起桥梁。
欧盟已花费数十亿欧元,为较贫困地区实验室的卓越中心提供资助。
这些中心是通过和较富裕国家的精英研究机构合作形成的。
不过,批评者认为,这些项目已被严重官僚化,受到政治和地理因素以及研究实力的影响,并且关注的是技术创新中心,而非单独的科学家。
波兰确实参与了欧盟项目,但表现得不是很好。
比如,今年该国研究机构仅获得了欧盟30项联合资助中的3项。
相比之下,捷克共和国获得了6项,塞浦路斯获得9项。
华沙国际分子和细胞生物学研究所一个研究小组负责人MarcinNowotny,是已从欧洲研究委员会获得资助的少数波兰科学家之
一。
“现在,波兰成了一个充满机会的国家,并且拥有卓越的国家资助体系。
”Nowotny表示“,但它需要更多切入点。
这个带有马普学会印记的项目将有助于实现这一点。
”(徐徐) 封锁卡塔尔重创全球氦供应 1/5健康成年人携带致病遗传变异 研究人员就是否将全基因组检测用于临床产生分歧 一些科学家梦想用简单的DNA扫描诊断疾病,或至少预测疾病风险。
但也有人表示,这种很快会成为预防医学基础的方法并不值得付出经济或社会成本。
现在,两项新研究为这一辩论引入了数据,其中一项研究是评估健康人整体基因组序列的首个随机临床试验。
两项研究均显示,测量健康成人基因组序列时每5人中有1人表现出罕见病或与癌症相关的遗传变异的风险标记。
这对那些人以及与基因筛查相关的所有卫生保健系统意味着什么仍不确定,但一些关注相关研究的人对这一研究结论表示欢迎。
美国马里兰州贝塞斯达国家人类基因组研究中心社会和行为学研究人员BarbaraBiesecker说:“非常了不起的是我们在研究实施这种新技术,而不是背着手、毫无证据地对它表示担心。
” 第一项基因组检测研究查看了100名健康成年人,他们均向初级护理医师报告了家族遗传病史。
接下来,其中一半人被随机分配进行另外的全基因组检查,这一过程每人花费约5000美元,以检查4600个基因的约500万个微小的DNA序列变化,即单核苷酸变异,这样的基因测序远远超过目前美国医学遗传学和基因组学学院(ACMG)建议的检测量,该机构建议仅告诉人们59个基因或可能具有明显致病性的基因检测结果。
在被测序的50人中,11人至少拥有可能导致疾病(通常是罕见病)的变异,研究人员6月26日在发表于《内科医学年鉴》的文章中报告了这一成果。
其中有一名患者对于太阳极为敏感。
其DNA揭示了一种叫作多样性卟啉病的皮肤病。
“现在,这些患者知道如果他们少接触太阳和一些医疗方法,被日光灼伤和出疹子的几率就会少得多。
”该研究领衔作者、波士顿 两项新研究表明5名健康成年人中就有1人存在DNA突变,可能使其遗传疾病风险增加。
图片来源:BlackJack3D/iStockPhoto 退役军人部医疗保健系统初级护理临床研究专家JasonVassy说。
该团队还发现,每一位测序患者均携带至少与一种疾病相关的一个隐性突变———一个单一的基因突变副本,它可能在两个副本出现的情况下致病。
这一知识可被用于生育决定(一对夫妻可以进行测试以了解他们是否携带匹配的突变)并让家庭成员检测其突变携带状态。
在Vassy称作“有些争议性的结果”中,该 团队检查了参试者发展出8个多基因疾病的几率,这种状况很少与单个基因变异有关。
他们编辑了这些多基因变异(II型糖尿病为70个,冠心病为60个)的整体效应,以预测患者发展该疾病的相关风险。
仅报告其家族史的志愿者中有16%的人曾参考了遗传咨询师的意见或是进行了后续的实验室测试。
而在基因组测试组中,这一数据为34%。
一些研究人员已经对类似的全基因组测序 表示担忧,认为这可能会让医疗成本飙升或是 造成过度的心理伤害。
除了最初的测序成本之 外(由该项研究覆盖),进行基因组测量的人在 随后的
6个月平均支付了350美元,Vassy和同 事报告称。
但与造成情绪创伤的担忧相反,测序 组或是控制组在研究后的6个月内均未表现出 任何焦虑或抑郁变化。
Vassy强调称,他们的研究规模很小,需要 进一步跟踪研究,但这一研究仍然给宾夕法尼 亚州丹维尔格伊辛格卫生系统遗传学家Christa Martin很深的印象,后者曾为ACMG基因组测 序提出过建议。
“我甚至觉得作者低估了自己的 研究。
”她说,“他们的很多患者正在产生健康行 为变化,因此他们正在以一种积极的方式利用 信息。
” 另一篇文章在早些时候发表于预印文本服 务器
bioRxiv,且尚未进行同行评议,但也得出 了类似结果。
该研究利用全外显子组测序,以检 查基因组蛋白质编码区域,加州斯坦福大学基 因组学和个性化医学中心主任MichaelSnyder 和同事发现,在70名健康成年人中,有12人并 不知晓其存在一个或多个DNA变异,这增加 了遗传疾病的风险。
Snyder说,两项研究均表明,医生应该跳 出ACMG列举的59个优先检查的基因范围。
他认为全基因组测序应该被“自动地”纳入初级 护理。
“你可能有很大的担忧,但我认为这些信 息对于医生仍然非常有用。
”然而,Vassy表示, 并没有足够证据让保险公司偿还健康人的全基 因组测序费用。
“我们想要快速修复,现在基因已成为一个 重要的文化象征,所以我们可能给了它超过实际 能力的更大权利。
”Koenig
说“,让这些技术应用 于临床仍然为时过早。
” (晋楠编译) 磁共振成像扫描仪依赖液态氦冷却超导磁体。
图片来源:JockFistick/BloombergviaGetty 科学家担心,他们可能会被迫停止试验或者关 闭实验室设备,因为持续进行的对卡塔尔的封锁正 在威胁他们的氦气供应。
这个海湾国家为全球医院 和实验室供应氦气。
然而,在围绕卡塔尔宣称支持恐 怖主义而起的政治争端中,沙特阿拉伯和
7个邻国 于今年6月封锁了其大部分进出口业务。
为此,卡塔 尔不得不关停两座氦气生产工厂。
“形势每天都在变化,所以我们每天都在密切关 注。
”在美国华盛顿大学研究核磁共振光谱法的化学 家SophiaHayes表示,“我非常担心。
”她的研究依赖 于持续的液氦供应以冷却实验室光谱分析仪中的超 导磁体。
液氦还被用于实验室的低温研究。
另一位要求匿名的科学家介绍说,其实验室正 在为核磁共振仪器储备可用的氦气。
如有必要,一位 大量使用氦气的年轻同事已同意减少其工作,以帮 忙解决氦气供应问题。
“这会对他的事业产生负面影 响。
所有资深的同事将尽可能避免出现这种情况。
” 上述科学家表示。
卡塔尔是全球最大氦气出口国和第二大氦气生产 国,满足了全球
25%的氦需求。
在新泽西州布里奇沃特 市专门研究氦气行业的咨询师PhilKornbluth表示,此 次封锁将不可避免地导致未来几个月出现氦气短缺。
离卡塔尔最近的国家可能会受到最严重影响。
诸如印度、日本、新加坡等东亚国家也有风险。
“没有 人会不受影响。
”西北大学低温物理学研究人员 William
Halperin表示。
实验室仅占据了氦市场约6%的份额。
大部分氦 被用于电子工业、医院核磁共振成像扫描仪以及飞 艇和气球。
这意味着当供应量受限时,供应商倾向于 优先满足大客户的需求,而非科学家。
很多研究人员曾希望,氦供应中断不会再发生, 因为大量的新工厂陆续在卡塔尔建立,保证了全球 氦供应。
不过,考虑到中东的政治动荡,Hayes
警告科 学界不要出现自满情绪。
(宗华)

标签: #什么意思 #数据 #山西 #做什么 #分析师 #数据 #长尾词 #软件