《人体简史》书摘
制造一个人需要多少钱
- 人体内第23常见的元素是镉,占体重的0.1%,毒性严重,我们吃植物的时候摄入了它
- 把所有最聪明的人召集在一起,也制造不了一个活细胞
- DNA是双螺旋结构的分子,是染色体的组成成分,基因是DNA的片段,所有基因的总和就是基因组
- 人体内大多数有用的物质都是蛋白质,加速化学变化的叫酶,传递化学信息的叫激素,攻击病原体的叫抗体
- 所有人类共享99.9%的DNA, 你有大约100来个基因和双亲都不一样,独属于你
- 几乎所有动物都能合成维生素C, 人类却不能
这是一本让人相间恨晚的好书。深动形象地将量子理论的发展脉络展现出来(什么时候我能在自己的专业领域做到这样生动的讲解,那便是一大进步了)。量子理论是理论物理的最前沿,也在实践中发挥出了巨大的作用。本篇读书笔记摘抄一些原文并附上一些自己粗浅的理解(极有可能是错误的,毕竟波尔说过“谁认为自己搞懂了量子理论,谁就并不懂量子理论”)。本书值得一刷再刷!
1900年12月14日这个日子,这一天就是量子的诞辰
站在20世纪的开头,对整个20世纪的科学发展方向起到了重要的决定作用。
之诺悖论:一个人无论如何无法追上一直乌龟。
小学的时候曾经困扰过我。大学学了极限理论之后在数学上证明了只是在一个固定时间之内无法追上。量子论从显示世界无法无限分割的新角度攻破了这个悖论
本文旨在搞清楚哈希函数、局部敏感哈希、MinHash、SimHash之间的关系。对利用局部敏感哈希来做最近邻查找的问题做一个梳理和总结。本文主要参考stanford公开课cs246的课件,讲得非常清晰,要系统的理解一个问题,还是得看这种课件,比网上搜索的碎片化信息有用多了。课件链接在文末的参考文档中,文中的截图均来自课件。
在机器翻译的任务中,合理选择词表和词表的大小至关重要。论文基于Marginal Utility(边际效益)这一经济学概念,提出通过最大化的Marginal Utiltiy of Vocabularization(下文简称MUV)的方式来优化下游任务。关于优化MUV的方法,又有搜索求解和VOLT(转化为Optimal Transport问题)两种方式,后者在效果接近的前提下大大节省计算量,更加低碳
这篇是ACL2020的最佳论文。论文指出现有的模型效果评估方案的问题,同时借鉴软件测试的方法,提出了一种全新的NLP模型测试方法(个人认为迁移到CV领域也不麻烦)CheckList。这种测试方案可以帮助人们更清晰、系统地了模型各个方面的优缺点。
未来已经在那儿了,只不过若隐若现而已
如果你问别人,必须把工作做完会去哪儿,很少有人会说办公室
办公室有太多的干扰
工作属于创意性工作时,固定的日程表有害无利
编程在某些方面也属于创意性工作
想想看,你给仅仅隔着三张桌子的同事发邮件了多少次?
- 当你推迟做决定,事情就会堆积起来,最后落得被遗忘的下场。只要有可能,就不要说“让我考虑一下”,而是“让我们做决定吧”
- 项目开发时间越长,成功的可能性越小(个人认为比较合适的周期是1周-1个月)
- 产品在精不在多(好的博物馆长会精心挑选展品而不是把所有的收藏都展示出来)
- 音乐就在你的指尖流淌(真正重要的是你的想法、技艺,不要过重的看待工具)
- 不要用抽象的方式来传递和沟通(抽象的事物,比如报告和文件,容易造成认知偏差)
- 当你需要和人合作的时候,采取被动交流工具,比如电子邮件,这样可以避免打岔降低你的工作效率(异步式的沟通)
给定schema的SPO抽取:从文本中抽取去SPO(Subject-Predicate-Object)三元组。其中Predicate是事先定义好的关系,Subject和Object是文中的span
