搜索
当前所在位置: 主页 > lol赛事押注儿童教育 >

《自然》评选改变科学的10个盘算机代码项目

发布时间:2021-09-28 20:08 作者:lol电竞赛事竞猜平台 点击: 【 字体:

本文摘要:从Fortran到arXiv.org,这些盘算机编码宁静台让生物学、气候科学和物理学等学科的生长到达了真正“日新月异”的速度。 2019年,事件视界望远镜团队让世界首次看到了黑洞的样子。 不外,研究人员宣布的这张发光环形物体的图像并不是传统的图片,而是经由盘算获得的。使用位于美国、墨西哥、智利、西班牙和南极地域的射电望远镜所获得的数据,研究人员举行了数学转换,最终合成了这张标志性的图片。

lol赛事押注

从Fortran到arXiv.org,这些盘算机编码宁静台让生物学、气候科学和物理学等学科的生长到达了真正“日新月异”的速度。  2019年,事件视界望远镜团队让世界首次看到了黑洞的样子。

不外,研究人员宣布的这张发光环形物体的图像并不是传统的图片,而是经由盘算获得的。使用位于美国、墨西哥、智利、西班牙和南极地域的射电望远镜所获得的数据,研究人员举行了数学转换,最终合成了这张标志性的图片。研究团队还公布了实现这一壮举所用的编程代码,并撰文记载这一发现,其他研究者也可以在此基础上进一步加以分析。如果没有能够解决研究问题的软件以及知道如何编写并使用软件的研究人员,一台盘算机无论再强大,也毫无用处  这种模式正变得越来越普遍。

从天文学到动物学,在现代每一项重大科学发现的背后,都有盘算机的到场。美国斯坦福大学的盘算生物学家迈克尔·莱维特因“为庞大化学系统缔造了多尺度模型”与另两位研究者分享了2013年诺贝尔化学奖,他指出,今天的条记本电脑内存和时钟速度是他在1967年开始获奖事情时实验室制造的盘算机的1万倍。“我们今天确实拥有相当可观的盘算能力,”他说,“问题在于,我们仍然需要思考。”  如果没有能够解决研究问题的软件,以及知道如何编写并使用软件的研究人员,一台盘算机无论再强大,也是毫无用处的。

如今的科学研究从基础上已经与盘算机软件联系在一起,后者已经渗透到研究事情的各个方面。克日,《自然》(Nature)杂志将眼光投向了幕后,着眼于已往几十年来改变科学研究的关键盘算机代码,并列出了其中10个关键的盘算机项目。

  这台CDC 3600型盘算机于1963年交付给位于科罗拉多州博尔德的国家大气研究中心,研究者在Fortran编译器的资助对其举行了编程  语言先驱:Fortran编译器(1957年)  最初的现代盘算机并不容易操作。其时的编程实际上是手工将电线毗连成一排排电路来实现的。

厥后泛起了机械语言和汇编语言,允许用户用代码为盘算机编程,但这两种语言都需要对盘算机的架构有深入的相识,使得许多科学家难以掌握。  20世纪50年月,随着符号语言的生长,特别是由约翰·巴克斯及其团队在加州圣何塞的IBM开发的“公式翻译”语言Fortran,这种情况发生了变化。

使用Fortran,用户可以用人类可读的指令来编程,例如x = 3 + 5。然后由编译器将这些指令转换成快速、高效的机械代码。

  不外,这一历程仍然很不容易。早期的法式员使用打孔卡来输入代码,而庞大的模拟可能需要数万张打孔卡。只管如此,新泽西州普林斯顿大学的气候学家真锅淑郎(Syukuro Manabe)还是指出,Fortran让非盘算机科学家也能编程,“这是我们第一次能够自己给盘算机编程”。

他和同事们使用这种语言开发的气候模型是最早取得乐成的模型之一。  Fortran生长至今已经到了第八个十年,它仍然广泛应用于气候建模、流体动力学、盘算化学等学科,这些学科都涉及到庞大线性代数并需要强大的盘算机来快速处置惩罚数字。Fortran生成的代码速度很快,而且仍然有许多法式员知道如何编写。古早的Fortran代码库仍然活跃在世界各地的实验室和超级盘算机上。

“以前的法式员知道他们在做什么,”美国水师研究院的应用数学家和气候模型师弗兰克·吉拉尔多说,“他们很是注重内存,因为他们拥有的内存很是少。”  信号处置惩罚器:快速傅立叶变换(1965)  当射电天文学家扫描天空时,他们捕捉到的是随时间变化的庞大信号杂音。

为了明白这些无线电波的本质,他们需要看到这些信号作为频率的函数时是什么样的。一种名为“傅里叶变换”的数学历程可以帮到研究人员,但它的效率很低,对于一个巨细为N的数据集需要N^2次盘算。默奇森宽视场阵列的部门夜景,这是一个建于澳大利亚西部的射电望远镜阵列,使用快速傅里叶变换来收集数据  1965年,美国数学家詹姆斯·库利和约翰·杜基想出了一种加速该历程的方法。快速傅里叶变换(FFT)通过递归(一种通过重复将问题剖析为同类的子问题而解决问题的编程方法)将盘算傅里叶变换的问题简化为N log2(N)步。

随着N的增加,速度也会提高。对于1000个点,速度提升约莫是100倍;100万个点则是5万倍。  这个“发现”实际上是一个再发现,因为德国数学家高斯在1805年就对此举行了研究,但他从未揭晓过。

而詹姆斯·库利和约翰·杜基做到了,他们开启了傅里叶变换在数字信号处置惩罚、图像分析、结构生物学等领域的应用,成为应用数学和工程领域的重大事件之一。FFT在代码中的应用已有许多次,近年一个盛行的方案是FFTW,被认为是世界上最快的FFT。

  保罗·亚当斯是加州劳伦斯伯克利国家实验室分子生物物理学和综合生物成像部门的主任,他回忆称,当他在1995年革新细菌卵白质凝胶的结构时,纵然使用FFT和超级盘算机,也需要“许多个小时,甚至数天”的盘算。“如果在没有FFT的情况下实验做这些,我不知道在现实中应该如何做到,”他说,“那可能要花很长时间。”  分子编目:生物数据库(1965年)  数据库是当今科学研究中不行或缺的组成部门,以至于人们很容易忘记它们也是由软件驱动的。已往的几十年中,数据库资源的规模急剧膨胀,影响了许多领域,但或许没有哪个领域的变化会比生物学领域更引人注目。

  卵白质数据库Protein Data Bank拥有凌驾17万个分子结构的档案,包罗这种细菌的“表达子”(expressome),其功效是联合RNA和卵白质合成的历程。  今天,科学家所用的庞大基因组和卵白质数据库源于美国物理化学家玛格丽特·戴霍夫的事情,她也是生物信息学领域的先驱。

20世纪60年月初,当生物学家们致力于梳理卵白质的氨基酸序列时,戴霍夫开始整理这些信息,以寻找差别物种之间进化关系的线索。她与三位合著者于1965年揭晓了《卵白质序列和结构图谱》,形貌了其时已知的65种卵白质的序列、结构和相似性。历史学家布鲁诺·斯特拉瑟在2010年写道,这是第一个“与特定研究问题无关”的数据集,它将数据编码在打孔卡中,这使得扩展数据库和搜索成为可能。

  其他“盘算机化”的生物数据库紧随其后。卵白质数据库Protein Data Bank于1971年投入使用,如今详细记载了凌驾17万个大分子结构。加州大学圣地亚哥分校的进化生物学家拉塞尔·杜利特尔在1981年建立了另一个名为Newat的卵白质数据库。

1982年,美国国立卫生研究院(NIH)与多个机构互助,建立了GenBank数据库,这是一个开放获取的DNA序列数据库。  这些数据库资源在1983年7月证明晰其存在价值。其时,由伦敦帝国癌症研究基金会卵白质生物化学家迈克尔·沃特菲尔德向导的团队,与杜利特尔的团队各自独立报道了一个特殊的人类生长因子序列与一种导致猴子泛起癌症的病毒卵白质之间的相似性。视察效果显示了一种病毒诱发肿瘤机制——通过模拟一种生长因子,病毒会诱导细胞不受控制地生长。

美国国家生物技术信息中心(NCBI)前主任詹姆斯·奥斯特尔说:“这一效果让一些对盘算机和统计学不感兴趣的生物学家头脑里灵光一闪:我们可以通过比力序列来相识有关癌症的一些情况。”  奥斯特尔还表现,这一发现标志着“客观生物学的到来”。

除了设计实验来验证特定的假设,研究人员还可以挖掘公共数据集,寻找那些实际收集数据的人可能从未想到的联系。当差别的数据集毗连在一起时,这种气力就会急剧增长。

例如,NCBI的法式员在1991年通过Entrez实现了这一点;Entrez是一个可以让研究人员在DNA、卵白质和文献之间自由检索和比对的工具。  预测领先者:大气环流模式(1969年)  在第二次世界大战竣事时,盘算机先驱约翰·冯·诺伊曼开始将几年前用于盘算弹道轨迹和武器设计的盘算机转向天气预测问题。真锅淑郎解释道,在那之前,“天气预报只是履历性的”,即使用履历和直觉来预测接下来会发生什么。

相比之下,冯·诺伊曼的团队“试图基于物理定律举行数值天气预测”。  新泽西州普林斯顿的美国国家海洋和大气治理局(NOAA)地球物理流体动力学实验室的建模系统部门卖力人Venkatramani Balaji表现,几十年来,人们已经熟知这些方程式。但早期的气象学家无法实际解决这些问题。

要做到这一点,需要输入当前的条件,盘算它们在短时间内会如何变化,并不停重复。这个历程很是耗时,以至于在天气状况实际泛起之前还无法完成数学运算。1922年,数学家刘易斯·弗莱·理查森花了几个月时间盘算德国慕尼黑的6小时预报。

lol赛事押注

凭据一段历史纪录,他的效果是“极禁绝确的”,包罗“在任何已知的陆地条件下都不行能发生的”预测。盘算机使这个问题变得很容易解决。  20世纪40年月末,冯·诺伊曼在普林斯顿高等研究院建设了天气预报团队。

1955年,第二个团队——地球物理流体动力学实验室——开始举行他所谓的“无限预测”,也就是气候建模。  真锅淑郎于1958年加入气候建模团队,开始研究大气模型;他的同事柯克·布莱恩将这一模型应用在海洋研究中。

1969年,他们乐成将二者联合起来,缔造了《自然》杂志在2006年所说的科学盘算“里程碑”。  今天的模型可以将地球外貌划分为一个个25公里×25公里的正方形,并将大气层划分为数十层。相比之下,真锅淑郎和布莱恩的海洋-大气团结模型划分的面积为500平方公里,将大气分为9个条理,只笼罩了地球的六分之一。

只管如此,Venkatramani Balaji表现,“这个模型做得很好”,使研究团队第一次能够通过盘算机预测二氧化碳含量上升的影响。  数字运算机:BLAS(1979年)  科学盘算通常涉及到使用向量和矩阵举行相对简朴的数学运算,但这样的向量和矩阵实在太多了。

但在20世纪70年月,还没有一套普遍认可的盘算工具来执行这些运算。因此,从事科学事情的法式员会将时间花在设计高效的代码来举行基本的数学运算,而不是专注于科学问题。  加州劳伦斯利弗莫尔国家实验室的Cray-1超级盘算机。

在BLAS编程工具于1979年问世之前,并没有线性代数尺度可供研究人员在Cray-1超级盘算机等机械上事情  编程世界需要一个尺度。1979年,这样的尺度泛起了:基本线性代数法式集(Basic Linear Algebra Subprograms,简称BLAS)。这是一个应用法式接口(API)尺度,用以规范公布基础线性代数操作的数值库,如矢量或矩阵乘法。

该尺度一直生长到1990年,为向量数学和厥后矩阵数学界说了数十个基本例程。  美国田纳西大学盘算机科学家、BLAS开发团队成员杰克·唐加拉表现,事实上,BLAS把矩阵和向量数学简化成了和加法和减法一样基本的盘算单元。  美国德克萨斯大学奥斯汀分校的盘算机科学家Robert van de Geijn指出,BLAS“可能是为科学盘算界说的最重要的接口”。

除了为常用函数提供尺度化的名称之外,研究人员还可以确保基于BLAS的代码在任何盘算机上以相同方式事情。该尺度还使盘算机制造商能够优化BLAS的安装启用,以实现在其硬件上的快速操作。  40多年来,BLAS代表了科学盘算客栈的焦点,也就是使科学软件运转的代码。

美国乔治·华盛顿大学的机械和航空航天工程师洛雷娜·巴尔巴称其为“五层代码中的机械”。而杰克·唐加拉说:“它为我们的盘算提供了基础结构。”  显微镜必备:NIH Image(1987年)  20世纪80年月初,法式员韦恩·拉斯班德在马里兰州贝塞斯达的美国国立卫生研究院的脑成像实验室事情。

该实验室拥有一台扫描仪,可以对X光片举行数字化处置惩罚,但无法在电脑上显示或分析。为此,拉斯班德写了一个法式。  这个法式是专门为一台价值15万美元的PDP-11小型盘算机设计的,这是一台安装在架子上的盘算机,显然不适合小我私家使用。然后,在1987年,苹果公司公布了Macintosh II,这是一个更友好、更实惠的选择。

拉斯班德说:“在我看来,这显然是一种更好的实验室图像分析系统。”他将软件转移到新的平台上,并重新命名,建设了一个图像分析生态系统。

  NIH Image及其后续版本使研究人员能在任何盘算机上检察和量化险些任何图像。该软件系列包罗ImageJ,一个拉斯班德为Windows和Linux用户编写的基于Java的版本;以及Fiji,这是ImageJ的分发版,由德国德累斯顿的马克斯普朗克分子细胞生物学和遗传学研究所的Pavel Tomancak团队开发,其中包罗关键的插件。“ImageJ无疑是我们所拥有的最基础的工具,”布洛德研究所(由麻省理工学院和哈佛大学团结建立)成像平台的盘算生物学家贝丝·契米妮说,“我从来没有和一个使用过显微镜,但没有使用过ImageJ或Fiji的生物学家说过话。”ImageJ工具在插件的资助下,可以自动识别显微镜图像中的细胞核  拉斯班德表现,部门原因可能是这些工具是免费的。

但威斯康星大学麦迪逊分校的生物医学工程师Kevin Eliceiri指出,另一个原因是用户可以很容易地凭据自己的需求定制工具。自拉斯班德退休后,Kevin Eliceiri的团队一直向导着ImageJ的开发。

ImageJ提供了一个看似简朴、极简主义的用户界面,自20世纪90年月以来基本上没有改变。然而,由于其内置的宏记载器(允许用户通过记载鼠标点击和菜单选择的序列来生存事情流)、广泛的文件花样兼容性和灵活的插件架构,该工具具有无限的可扩展性。该团队的编程主管柯蒂斯·鲁登表现,有“数以百计的人”为ImageJ孝敬了插件。

这些新添加的功效极大扩展了研究人员的工具集,例如在视频中跟踪工具或自动识别细胞的功效。  Kevin Eliceiri说:“这个法式的目的不是做到一切或终结一切,而是服务于用户的目的。不像Photoshop和其他法式,ImageJ可以成为你想要的任何工具。

”  序列搜索器:BLAST (1990年)  可能没有什么能比把软件名称酿成动词更能说明文化的相关性了。提到搜索,你会想到谷歌;而提到遗传学,研究者会连忙想到BLAST。  通过诸如替代、删除、缺失和重排等方式,生物将进化中的改变蚀刻在分子序列中。寻找序列之间的相似性——特别是卵白质之间的相似性——可以让研究人员发现进化关系,并深入相识基因功效。

在迅速膨胀的分子信息数据库中,想要快速而准确地做到这一点并不容易。  玛格丽特·戴霍夫在1978年提供了关键的希望。

lol电竞赛事竞猜平台

她设计了一种“点接受突变”矩阵,使研究人员不仅可以凭据两种卵白质序列的相似水平,还可以凭据进化距离来为评估它们的亲缘关系。  1985年,弗吉尼亚大学的威廉·皮尔森和NCBI的大卫·利普曼引入了FASTP,这是一种联合了戴霍夫矩阵和快速搜索能力的算法。

  数年后,利普曼与NCBI的沃伦·吉什和斯蒂芬·阿特舒尔,宾夕法尼亚州立大学的韦伯·米勒,以及亚利桑那大学的吉恩·迈尔斯一起开发了一种更强大的革新技术:BLAST(Basic Local Alignment Search Tool)。BLAST公布于1990年,将处置惩罚快速增长的数据库所需的搜索速度,与提取进化上更为遥远的匹配效果的能力联合起来。

与此同时,该工具还可以盘算出这些匹配发生的概率。  阿特舒尔表现,盘算效果出来得很是快,“你可以输入搜索内容,喝一口咖啡,搜索就完成了。”但更重要的是,BLAST很容易使用。在一个通过邮寄更新数据库的时代,沃伦·吉什建设了一个电子邮件系统,厥后又建设了一个基于网络的架构,允许用户在NCBI盘算机上远程运行搜索,从而确保搜索效果始终是最新的。

  哈佛大学的盘算生物学家肖恩·艾迪表现,BLAST系统为其时处于萌芽阶段的基因组生物学领域提供了一个厘革性的工具,即一种凭据相关基因找出未知基因可能功效的方法。对于各地的测序实验室,它还提供了一个新颖的动词。“它是众多由名词酿成动词的例子之一,”艾迪说,“你会说,你正准备BLAST一下你的序列。

”  预印本平台:arXiv.org (1991年)  20世纪80年月末,高能物理学家经常将他们已投稿的论文手稿副本邮寄给同行,征求他们的意见——但只发给少数人。物理学家保罗·金斯帕格在2017年写道:“处于食物链较低位置的人依赖于一线研究者的结果,而非精英机构中有理想的研究人员则往往身处特权圈以外。”  1991年,其时在新墨西哥州洛斯阿拉莫斯国家实验室事情的金斯帕格编写了一个电子邮件自动应答法式,希望建设一个公正的竞争情况。

订阅者天天都市收到预印本列表,每一篇都与文章标识符相关联。只需通过一封电子邮件,世界各地的用户就可以从实验室的盘算机系统中提交或检索论文,并获得新论文的列表,或按作者或标题举行搜索。arXiv建立已近30年,有约180万份预印本,全部免费提供,而且每月有凌驾1.5万份论文提交,下载量达3000万次  金斯帕格的计划是将论文保留三个月,并将内容限制在高能物理学界。

但一位同事说服他无限期地保留这些文章。他说:“就在那一刻,它从布告栏酿成了档案馆。

”于是,论文开始从比各个领域如潮水般涌来。1993年,金斯伯格将这个系统迁移到互联网上,并在1998年将其命名为arXiv.org,沿用至今。

  arXiv建立已近30年,拥有约180万份预印本,全部免费提供,而且每月有凌驾1.5万份论文提交,下载量达3000万次。十年前,《自然-光子学》(Nature Photonics)的编辑在评论arXiv建立20周年时写道:“不难看出为什么arXiv的服务会如此受接待,这个系统让研究人员能快速而利便地插上旌旗,显示他们所做的事情,同时制止投稿传统同行评议期刊时的贫苦和时间成本。”  arXiv网站的乐成也促进了生物学、医学、社会学和其他学科同类预印本网站的繁荣。在如今已出书的数万份关于新冠病毒的预印本中就可以看到这种影响。

“很兴奋看到30年前在粒子物理学界之外被认为是异端的方法,现在被普遍认为是平淡无奇和自然而然的,”金斯伯格说,“从这个意义上说,它就像一个乐成的研究项目。”  数据浏览器:IPython Notebook (2011年)  2001年,费尔南多·佩雷斯还是一位希望“寻找拖延症”的研究生,其时他决议接纳Python的一个焦点组件。  Python是一种解释型语言,这意味着法式是逐行执行的。

法式员可以使用一种称为“读取-评估-打印循环”(read–evaluate–print loop,简称REPL)的盘算挪用和响应工具,在其中输入代码,然后由解释器执行代码。REPL允许快速探索和迭代,但佩雷斯指出,Python的REPL并不是为科学目的而构建的。例如,它不允许用户利便地预加载代码模块,也不允许打开数据可视化。

因此,佩雷斯自己编写了另一个版本。  效果就是IPython的降生,这是一个“交互式”Python解释器,由佩雷斯在2001年12月推出,共有259行代码。

十年后,佩雷斯与物理学家布莱恩·格兰杰和数学家埃文·帕特森互助,将该工具迁移到web浏览器上,推出了IPython Notebook,开启了一场数据科学革命。  与其他盘算型Notebook一样,IPython Notebook将代码、效果、图形和文本合并在一个文档中。但与其他类似项目差别的是,IPython Notebook是开源的,邀请了大量开发者社区的到场其中。而且它支持Python,一种很受科学家接待的语言。

2014年,IPython演变为Jupyter,支持约莫100种语言,允许用户在远程超级盘算机上探索数据,就像在自己的条记本电脑上一样轻松。  《自然》杂志在2018年写道:“对于数据科学家,Jupyter实际上已经成为一个尺度。

”其时,在GitHub代码共享平台上有250万个Jupyter Notebook;如今,这一数字已经生长到1000万个,在2016年引力波的发现,以及2019年的黑洞成像事情中,它们都发挥了重要的作用。佩雷斯说:“我们对这些项目做出了很小的孝敬,这是很是值得的。”  快速学习器:AlexNet(2012年)  人工智能有两种类型。

一种是使用编码规则,另一种则通过模拟大脑的神经结构来让盘算机“学习”。加拿大多伦多大学的盘算机科学家杰弗里•辛顿表现,几十年来,人工智能研究人员一直认为后者是“一派胡言”。但在2012年,他的研究生亚力克斯·克里泽夫斯基和伊尔亚·苏茨克维证明晰事实并非如此。  在一年一度的ImageNet角逐中,研究人员被要求在一个包罗100万张日常物体图像的数据库中训练人工智能,然后在一个单独图像集上测试生成的算法。

辛顿表现,其时最好的算法错误分类了约莫四分之一的图像。克里泽夫斯基和苏茨克维的AlexNet是一种基于神经网络的“深度学习”算法,它将错误率降低到了16%。辛顿说:“我们基本上把错误率减半了,或者说险些减半了。

”  辛顿还指出,该团队在2012年的乐成反映了足够大的训练数据集与精彩的编程,以及新泛起的图形处置惩罚单元的强大能力的联合。图形处置惩罚单元是最初设计用来加速盘算机视频性能的处置惩罚器。

“突然之间,我们可以将(算法)运行速度提高30倍,”他说,“或者说,学习多达30倍的数据。”  真正的算法突破实际上发生在三年前,其时辛顿的实验室建立了一个神经网络,可以比经由几十年革新的传统人工智能更准确地识别语音。“只是稍微好一点,”辛顿说,“但这已经预示了某些工具。”  这些乐成预示着深度学习在实验室研究、临床医学和其他领域的崛起。

通过人工智能的深度学习,手性能够明白语音查询,图像分析工具能够很容易地在显微照片中识别出细胞;这就是为什么AlexNet会成为众多从基础上改变科学,也改变世界的工具之一。(任天)。


本文关键词:lol电竞赛事竞猜平台,《,自然,》,评选,改变,科,学的,10个,盘算机,从

本文来源:lol赛事押注-www.tesshou.com

阅读全文
返回顶部