这些进步其实都来自于我们对于疾病的深入了解,对于人体运行机制和生理变化的掌握有了新工具。但是从2000年人类基因组计划提供了完整的人类基因序列以来,我们仍然对大量的基因功能不甚了解,一些序列一度被认为是“垃圾基因”。从斯坦福大学加入硅谷风投公司安德森霍洛维茨(Andreesen Horowitz)的维杰·潘德(Vijay Pande)教授就认为生物界在漫长的演进过程中产生了大量的系统漏洞。
但今天科学界的部分学者认为这些系统设计看似存在缺陷,可能更大程度上是因为我们目前的知识有限,对生命科学的了解仍然处在非常早期的阶段。我们目前的诸多重大发明发现(至少在上世纪七十年代基因技术兴起之前)都源自意外,而不是精心设计的实验,比如1928年“没盖好盖子”的英国皇家陆军医疗队队长亚历山大·弗莱明爵士(Sir Alexander Fleming)发现了青霉素。
“by design”还是“by accident”实际上是个很令人烦恼的事情,所以2021年最积极的生命科学投资者 RA Capital(波士顿的这家交叉轮投资老手去年参与了60个项目,平均每个项目一亿美元)从十多年前就建立了 TechAtlas 团队来追踪各个病种、靶点和技术对于治疗和临床的帮助。今天这个靶点地图已经追踪了130种疾病、技术平台和关键企业的所有治疗和诊断方案,无人可以企及。
但就算如此,这些庞大的数据地图仍然只代表着整个科学界对生命片光零羽的了解,这个工作还可以进行很多年。如果从五十年代詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)发现DNA开始算起,我们也只是在最近一些年才真正进入“数据”时代。直到我们2000年可以完整获得果蝇基因序列的时候,单一数据集规模也只有120兆。
从2000年人类基因组计划以来,我们的基因工具得到了前所未有的提升:最早的桑格测序法(Sanger method)从1977年开始几乎使用了快30年!工具不改变,我们的效率就无法提升,但也是直到2007年刚刚上市不久的 Illumina 公司收购了1998年成立的 Solexa 才彻底拉开了“高通量”测序的帷幕。
被行业寄予厚望的第三代测序皇冠——Oxford Nanopore,也是经历了16年的发展才在去年刚刚上市,而大家经常会忽略的一点是,其实早在1989年于加州理工戴维斯分校任教的大卫·狄默(David Deamer)教授就在构思这个技术了(1996 PNAS Braonton, Deamer et al.)。
我们处在科学大爆发的时代前沿,创新在全球范围内不断涌现。根据美国国家生物科技信息中心(NCBI)的数据,1982年基因银行(GenBank,注:一个开放的基因序列库)只有606个序列,现在有2.34亿个序列,其中的碱基数据量截至2021年12月已经超过一万亿,平均每18个月翻一倍(如下图):
当李飞飞教授宣布停止 ImageNet 服务的时候,人工智能行业已经不再需要一个公益平台来帮助各家提供数据了,但在生命科学领域,尽管某些单一维度的数据量似乎已经很大,我们仍然需要更大规模的数据。
早在1981年10月5日,《财富》(Fortune)杂志就发布了一篇封面报道,题为《The Next Industrial Revolution: designing drugs by computer at Merck》。而时至今日最成功的 AI 制药研发平台薛定谔(NASDAQ: SDGR)也只有不到20亿美元的市值,想当年这是肖氏基金公司(D.E. Shaw)豪掷3000万美元砸出来的世界首创,今天仍然不及预期;后起小生 Relay Therapeutics(NASDAQ: RLAY)也从2021年1月高点的66亿美元估值跌到目前的23亿美元……这些波折省去不谈,结论是我们其实仍然处在AI制药的早期阶段,相当一部分计算背景的科学家仍然认为数据不够,AI制药只是无米之炊。
从计算机辅助药物设计(CADD)到AI制药其实还有距离,但在一些细分领域,比如诊断和蛋白质结构预测,我们已经可以开始看到曙光,例如2021年12月拿到罗氏和 GV 三亿美元投资的多组学公司 Freenome 就属于用液体活检老树开 AI 新花的典型。另外,去年行业最大重磅消息就是 DeepMind 开源AlphaFold2,该平台可以准确预测蛋白质结构,并且远超人类大师水平【这个领域的执牛耳者、华盛顿大学生化系“亨丽埃塔和奥布瑞·戴维斯(Henrietta and Aubrey Davis)”荣誉教授大卫·贝克(David Baker)历史上发表过500多篇论文、拥有100多项专利、共同创立了11家企业】:
关键是这个技术每年还都在突飞猛进(CASP: Critical Assessment of protein Structure Prediction是每年一度的行业盛会)如下图:
一家成立10年的公司(DeepMind成立于2010年)可以挑战专家整个职业生涯的成就,这既让人心潮澎湃,又令人胆心:人类知识的保值率到底能持续多久?
这只是最近十年出现的交叉科技案例之一,除了 AI 还有很多交叉领域都在与生命科学结合:微电子(神经刺激治疗帕金森症以及 Neurolink 脑机接口)、机器人技术(达芬奇手术机器人和 Auris Health)、材料科技(用 iRhythm 替代传统心电监护系统、最近非常流行的ICL技术:可植入式隐形眼镜)、声学(Shockwave 治疗血管钙化)……不胜枚举。
今天的生命科学创新不仅仅停留在传统的生物化学和医疗器械代际更新上,尤其是在大厂完全没有动力推动交叉领域或者前沿科学的产业转化的情况下,早期的原始创新更加需要创业公司来完成。
这对于我们华创团队这样交叉背景的投资人其实非常有利,因为我们同时在跟踪很多领域的技术进展:比如2017年投资 AI 工业机器人的时候我们就开始考察医疗机器人,之后落子由清华生医系教授和博士们创立的华科精准,美敦力紧随追投;投资 AI 半导体深鉴科技(之后卖给国际巨头赛灵思)的时候,我们和脑机接口的专家相识,落子清华电子系和中科院过程所教授创立的宁矩科技,沙特新未来城(Neom City)背后的阿美石油集团科技投资快速跟投;投资 AR 眼镜的时候,我们对颅内手术规划有了概念,大大加深了我们对神外手术机器人领域的理解……这些跨行业的新技术当时都是传统医疗基金忽视的领域。
今天的创新需要交叉型人才,他们很难得,所以更重要的是我们的行业要有更多交叉合作。例如,我们在内部就已经融合了化学、生物、电子、计算机、材料和通讯的同事一起讨论项目:我们生医背景的同事可以和化学同事一起合作投资合成生物学,工业工程同事可以帮助确认用在第三代测序仪上的半导体工艺,药学和计算机同事可以一起探索数字疗法的临床可行性……这些都是崭新的工业话题,需要有全面的技术背景和商业知识才能有机会管中窥豹,也和传统医疗基金跟踪药厂高管进行的投资路线非常不同。
这些原始技术创新大多都来自科研院所,教授们已经在细节上花费了几万小时的时间,作为一个跨界前沿科技投资者,我们的价值就在于帮助这些非同寻常的创新企业起飞:寻找管理团队、提供资金、落地场景、业务伙伴介绍等等,不一而足。
我们始终相信处于创新阶段的市场一定是百花齐放的:下一代生产力绽放的早期、前沿技术工业化的非共识阶段,是我们交叉科技投资人最重要的战场。