会员通讯4321X 第4期

聊聊不确定性和写作

你现在看到的是熊言熊语会员通讯4321X的第4期试读版本,今后我们会不定期的将部分会员通讯内容发布到公开平台,如果想稳定的阅读每期内容欢迎通过邮件订阅这份免费的会员通讯服务。

Hi, 见信好:

我是思考问题的熊,你现在正在阅读的是熊言熊语会员通讯「4321X」第4期。

截至本期通讯,「4321X」订阅人数为:506。


刊首语

今天查看邮件推送服务的后台,发现会员通讯「4321X」订阅已经超过了500人。当然,后续的增长会进入一个非常缓慢的过程,慢慢来吧。如果你留心观察每期通讯的开头内容,可以看到我都会写清楚截至当期邮件推送时和你一起收到这封邮件的人数,这么一是提醒自己要认真对待,二是想告诉收到邮件的你并不孤单。

不过,距离上一次推送newsletter已经过去两周多时间了,就着这次没有及时更新的问题,本期的刊首语想聊聊关于确定性和不确定性的话题

小到个人,再到团队和公司,大到国家,都存在着如何应对不确定性的问题。所谓不确定性,通俗的理解是无法根据过去的经验来推断事件未来发生的概率。在深度学习中关于不确定性有两种解释:一种是偶然不确定性(Aleatoric Uncertainty),是由于观测数据中固有噪声导致的,这种不确定性增加实验数量也无法被消除,但可以更准确的给出结果变异的概率分布;第二种是认知不确定性(Epistemic Uncertainty),它与模型相关,主要是由于缺乏知识引起的,如果我们获得了有关研究对象足够的知识,理论上就可以消除这种不确定性。

这里我们主要谈的是基于个人的认知不确定性。

不确定性会带来什么问题呢?不确定性带来的最大问题是焦虑,如果既成事实摆在面前我们可能会恐惧,但是如果不确定的事情存在我们就会焦虑。最简单的例子是等待体检结果和拿到体检结果后的两种体验。恐惧是人面对现实危险的正常反应,焦虑就是面对潜在想象中危险的过度反应。

当然,如果生活中完全都是确定性也不行,在一个极度安全的舒适区所有事情都可以被预测,多数创意或者想法其实都是在适度不确定性中产生的。我们能做的首先是认识到这种不确定性的存在,然后主动增加一些不确定性的同时还得给自己营造一些固定的仪式感。

所谓认识到不确定性的存在,就是能够区分能力和运气,信号和噪音,还要能够区分因果。人的抗击打能力很强,有一种非常火的锻炼方法叫做高强度间歇性训练(HIIT),我的理解这就是给确定的身体机能偶然来一些强度逐渐提高的不确定性,生病也是一个道理,平时有个偶尔的头疼脑热其实也是不确定性的体现。

主动增加一些不确定性,从个人角度来说可以是主动学一些专业外的内容,做一些本专业之外的事情。面对未知的内容,人很容易增加斗志和好奇心,这样才容易看到自己更多的可能性。换个角度想,多做一些出人意料的事情,也是给这个世界多增加一些不确定性。如何最简单的践行呢?你可以每周有两三天选择不同的路线回家,甚至「不经意」的坐过一站然后再走回家。很多人都不知道自己家的下一站路上有些什么东西。

所谓营造固定的仪式感,就是刻意的给自己一点确定的感觉。比如很多人都有一件在重要场合才会穿的衣服,在做重要事情之间都会做的个人癖好。这件衣服和某个爱好不一定真能带来好运,但会让你明显感受到一种状态转换和积极的心理暗示。实践起来,比如你可以每天坐到工位上之后先固定浏览10分钟某一个杂志网站的信息,然后再开始工作,每天睡觉之前都读20页书。

对我来说,写作就是一个主动选择不确定性的行为,每天我会把看到的各种内容记录整理,播客也是一个主动选择不确定性的行为,不同的嘉宾会给我带来不同的思考。写会员通讯和制作播客虽然于我是不确定性大于确定性的过程,但希望它们对于你来说能变成一种确定性。

其实这件事儿也没有那么难,写不出来3千字的内容我可以写300字,制作不了60分钟的节目可以制作6分钟。因此我会尽快稳定找到一个固定的时间和频率进行更新,无论我这边出现了什么不确定,争取到了固定的时间它就会出现的你的生活里,让你多一点安心。


文献

本期的专业文献板块不会推荐具体内容,分享一点文献整理心得。

我曾经录制过一期关于如何追踪文献的播客节目「像追剧一样追踪文献和前10期小回顾」,把追文献和追剧做了类比,这次的内容算是一点补充。

如果说大多数科研成果转换到产业可能需要10–20年的时间,例如PD-1从2000年前后被文献广泛报道到2014年2015年陆续上市,那想了解一个行业最近几年都在做什么就可以看看第一梯队公司近期发表的文章。

最近看到几个国内主流肿瘤基因检测公司在自己的公众号汇总过去一年的学术成果,我就顺手在Pubmed上用Affiliation这个字段进行了一些搜索和整理,搜索的公司包括燃石、吉因加、思路迪、世和、至本、泛生子、臻和以及海普洛斯等。

找到的文章一共有560多篇,其中影响因子在20分以上的文章有17篇,影响因子在10分以上的文章有91篇(包括20分以上)。如果你感兴趣也可以自己搜搜看。

从文章数量上来说,吉因加、燃石以及世和最近几年整体的学术产出最高,文章的数量或许可以从一个侧面反映一些公司拥有的样本和医生资源或者发展策略。500多篇文章的影响因子多数是3–5分,主要研究课题集中在肺癌和消化道癌,范癌研究也有不少。

从杂志上来看,J Thorac Oncol、Lung Cancer、Onco Targets Ther、Oncologist、Clin Cancer Res、Cancer Biol Ther、Cancer Med、Front Oncol、Oncol Lett、Ann Transl Med、J Immunother Cancer、Medicine (Baltimore)、Transl Lung Cancer Res、Sci Rep、J Cancer 和 Nat Commun 这些期刊上发表的数量达到了10篇及以上。

今后的一部分文献内容,我就会从这500多篇中进行挑选。


思考

人生的商业模式主要有三种:同一份时间出售一次,重复出售同一份时间,购买他人的时间再出售。

最近关于996的社会热点事件一个又一个,比如拼多多外包运营在没有切换个人账号情况下表达了如下心声:「你们看看底层的人民,哪一个不是用命换钱,我一直不以为是资本的问题,而是这个社会的问题,这是一个用命拼的时代,你可以选择安逸的日子,但你就要选择安逸带来的后果,人是可以控制自己的努力的,我们都可以。」

不过,无法决定自己的劳动时间在我看来确实是资本的问题。

在自给自足的时代,人从事生产的时间只需要用来维持自己的生活即可。你可以选择用多少时间产多少粮食,够用就好,多了也吃不了。但是,当作为打工人仅仅以出售时间出现在资本市场的时候,我们没有生产工具和生产条件,资本家们就对我们的劳动时间产生了强大的话语权。我们无法衡量究竟用多少时间可以换来自己的生产所需。

此外,有人说996是因为工资高,但是时薪制以外的工作和工时本身就不是绝对相关的,工资反应的应该是公司对你的期望或者你能给公司带来的效益。如果一定要理解高工资就应该每天工作12甚至16个小时,计件和计时工作制或许可以说明目前互联网大厂的很多岗位已经回到了劳动密集型。

李笑来曾经在他的一本书里总结过人生的商业模式主要有三种:同一份时间出售一次,重复出售同一份时间,购买他人的时间再出售。绝大部分人都是第一类,创业公司和大公司的领导们做的是第三类。我们这种普通人还可以在第二类稍微尝试尝试,比如写作就是重复出售同一份时间的最好示例。

一个小例子,5年前我曾经写过一本关于考研相关的文集「聊聊考研复习这件事」,包含随笔文章、不同科目复习心得、英语真题解读和英文新闻精读几个部分,文笔稚嫩但是绝大部分内容如今看来也没有过时。我从后台粗略统计,去年它的访问量依旧有8000多,这还不算流传在民间的几个PDF版本。嗯~如果你身边还有准备考研的朋友不妨把这个文集推荐他。


珍惜用自己的时间与金钱(反复)消费你(产品)的人。

可能上文提到的阅读人数在很多人看来算不上一种商业模式,因为压根就没见到钱。但是消费方式除了钱以外现在还被认可的就是消费时间。最新一起的财新周刊的封面报道就关注到了最近备受关注和争议的「数字税」。

国内关于数字税的讨论和国外的重点不太一样,简单说欧盟等国家更关注的是数字化可能会加剧跨国公司税基侵蚀和利润转移(BEPS)的问题,即跨国企业利用国际税收规则存在的不足以及各国税制差异和征管漏洞,最大限度减少其全球总体的税负,甚至达到双重不征税的效果,造成对各国税基的侵蚀。

但是在国内,管理层更加关注的是用户带来的平台价值,根据中国信息通信研究院的测算,2019年中国数字经济规模达到5.2万亿美元,居全球第二,占GDP的比重超过30%。基于“用户创造价值”的理念,作为公众代表,政府是否有必要像征收自然资源税一样,对平台企业征收数字服务税,值得深入研究。甚至不乏意见认为,向互联网企业征收以用户数量为基础的数字服务税,收入可以与征收土地出让金相提并论,有望成为一项中国本土的“创新”税种。

大概的意思就是,我们每个人平时花费自己的时间在各种社交平台上,一方面把自己作为「资源」帮平台通过广告挣钱,另一方面今后很有可能还会被作为「资源」为国家贡献税收。

所以,还是把自己的时间多花在一些给自己创造价值的事情上吧,另外就是要珍惜那些在你身上花了大量时间或者反复花费时间的人。

2020年有1.5万人访问了我的个人网站,有效访问会话数有2.1万,平局会话时长是2分钟,这么算下来就是700个小时或者30天的时间。

最感动的是,过去一年有三位朋友和我的交流次数超过了100次,虽热从未谋面但绝对是很深的交情了。其中最多的一位访问了363次,会话时常超过了38个小时,希望你我的文章有帮助你解决一点问题。

2020年5月18日,一位朋友在网站上停留了1小时40分钟,是单次停留最长的,希望你现在已经顺利的用上了Zotero。

我也鼓励每位看到这封会员通讯的你从2021年开始写作吧。


范围蔓延、范围蠕变都是生物信息学项目面临的主要挑战。项目起始就要制定好分析计划,不要突然或大幅度改变项目范围和期望,不要浪费资源,确保项目范围是可控的,同时也要管理好分析的期望。

我在博客上翻译了一篇文章:需要时刻留心的24个生物信息学提示。文章中提到了24个学习生物信息需要注意的问题。其实大多数不仅适用于生物信息而是适用于所有科学研究,看似简单但需要我们时刻留心。

其中我感受最深的是第9条 管理范围和预期,提到的范围蔓延、范围蠕变其实都是项目管理中的概念。我们确实应该把自己的课题也看作一个项目,做好自己的项目经理,从这个角度来说人人都应该学习一些项目管理的基本概念和方法。

如果你想阅读其余23点注意事项,可以阅读这篇博客


推荐

VScode

VScode是我最喜欢用也是最喜欢安利的代码编辑器,目前最常用的方式是使用remote功能通过ssh链接服务器进行使用,界面一分为二,远程文件可以实时编辑保存,同时在VScode里直接调用终端跑数据测试结果,非常顺滑。这次在这里推荐是想说它不仅仅可以用来写代码,无论是码字写文章还是用来做基于文档的项目任务管理都很方便。我曾在一篇文章里按照5个应用场景介绍过VScode的用法,如果你还没有尝试过,不妨了解一下。 VS Code 代码编辑器入门指南下篇-场景化应用介绍

飞书

飞书是我过去一年使用很多的一个IM工具,尤其是在彻底放弃使用电脑端微信以后。关于微信我可以克制自己不要太吐槽,但最不能忍的是它始终会占用我MacBook里10G左右的存储容量,让一共只剩下不到90G可用空间的笔记本捉襟见肘。此外,卸载掉微信桌面端以后感觉工作效率也略微有了一些提升,很多群消息就懒得再拿起手机专门刷了。

提到飞书不仅仅是为了推荐一个软件,我想说如果你对效率有些追求的话,可以适当跳脱出微信看看更多的工具。从协作这个层面来说,Slack是很好的选择,从聊天这个层面来说,Telegram和Discord也都非常不错。当然,这些工具都有一定的学习成本或使用成本(比如有些需要VPN)需要克服。

字节跳动的飞书在国内目前确实是很不错的产品,尤其是已经单独发布的飞书文档。我曾经在去年初写过一篇文章:把飞书融入日常学习流程:一个人的飞书也挺好。因为这篇文章我陆续接触到了几个在字节跳动不同部门工作的读者。文章里我有涉及到当时自己的一些信息处理思路,虽然如今又有所变化但是依旧可以参考。


讨论

要不要读博士

最近收到了一个朋友的来信。信很长,简单来说这位朋友:

2020年上半年抱着不能「延期丢人」的信念挣扎毕业之后最近半年各种不顺利,申请国外和国内的几个学校纷纷失败,有科研助理的机会也不太想去。毕业半年目前没有工作而且2021年已经读博无望,28岁的年纪也让他很挣扎要不要继续读博。

于是我给他回信说了一点我对于读博的感受和想法,例如:

不要为了取悦别人(比如父母)而读博,这样今后遇到的各种不顺心都容易归结给对方;不要因为别人(比如导师)的热情鼓励而读博

读博并不是推迟工作的方法,因为它本身就是一个职业选择和一次职业培训,这些职业又大多数局限于高校或者高度专业化的相关领域

如果一个人经常需要表扬或者习惯于接受肯定,也要对读博慎重考虑。博士阶段接受到的反馈,坏的一定比好的多(阴性结果一定比阳性多);反馈并不频繁(一个实验经常需要十天半月)且非常滞后(一个课题文章发表往往要两三年)。

更多的内容可以阅读: 要不要读博(答读者信)

如果你也有关于给犹豫读博的朋友一些建议,可以回复邮件进行交流。


one more thing

本期通讯的one more thing是来向你「收租」的,如果你自己平时有在写博客之类的东西,或者有经常会发些个人想法的公开账号,都可以回复邮件分享给我。我很乐意多读读你写的内容,了解一下你的想法。就像是,小时候的笔友?


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

熊言熊语会员通讯「4321X」是一个免费的订阅服务。
每期会为你推荐 4 篇生物信息或者医学相关文献,分享 3 个我过去一段时间的思考,介绍 2 个我喜欢的工具,同时提出 1 个问题供我们交流,而 X 则代表不固定的 one more thing。可以点击这里进行订阅。