正如百度董事长兼 CEO 李彦宏在今年 5 月举办的首届中国生物计算大会上所言,「生物计算是个高度融合的学科…依靠生物计算引擎,能够有效利用大量的生物数据,把药物发现的『大海捞针』变成『按图索骥』,为人类的生命健康谋取福祉。」
它们有造血能力和稳定的现金流,对人才也有更强的吸纳能力,因此也就更有希望看到技术与产业落地的黎明到来。
百度是中国科技公司中的 AI 强企,并且在生物计算领域也早早便开始布局,目前在算法、算力等层面均位于业界前列。
今年 5 月,PaddleHelix 已经升级到了 1.0 正式版本,在 GitHub 开源的同时,也新增了化合物预训练模型 ChemRL、基于序列的分子生成模型、药物联用模型和在线 web 页面(。
2015 年,在百度与协和医院就肿瘤研究合作的一个发布会上,李彦宏讲了一段轶事。他说在 20 多年前就对生物信息学极感兴趣,还在华尔街做程序员时,特地申请了 Merck(默克集团,德国生命科学巨头)一个研究小组的工作,并且拿到了 Offer。
不过人类对未知的探索从来不会止步,新一轮技术浪潮给医药领域带来了新变量,在人工智能加持下的「生物计算」。
但是事物的另一面在于,这些公司也因为资本市场的估值惯性,许多潜力业务被打包折价了。比如百度(美股)当前滚动市盈率(PE-TTM)仅为 9.0,作为对比,阿里为 24.5,腾讯为 26.9,谷歌 33.8,微软 34.9,亚马逊则高达 65.4,即便是回退到新一季财报发布之前,百度滚动市盈率也长期处在 20 倍以内。
它不但能够带来创新药物的研发突破,包括后面的生产、消费环节也会随之改变,比如目前药企需要在专利保护收回研发成本,因此创新药普遍价格高昂,但是随着像百度 Linear 系列算法、以及 PaddleHelix 这样的生物计算平台介入到新药研发之中,药企实现了降本增效,消费市场也将因此收益,以更快的速度、和更便宜的价格用到创新药。
实际上,对谋求长远的企业来说,比起价值被低估,战略上的定力更加关键。微软在 2010 年到 2014 年期间市盈率也曾长期在 10~15 倍徘徊,彼时微软被认为没有赶上移动互联网浪潮,但微软通过对云战略的坚定执行,价值最终重新被资本市场发现。
到了 11 月,谷歌旗下 DeepMind 团队开发的 AlphaFold2,在 2020 年生酮质结构预测大赛 CASP 14 中取得惊人突破,预测结构中位数得分 92.4,可以认为和真实结构已经基本一致,困扰学界数十年的生酮质分子折叠问题见到了黎明曙光。
生物计算始于 20 世纪 80 年代中期,这些年来一直在不断发展,而与 AI 算法的结合,让这个新兴领域受到前所未有的关注。
比如说上市之路颇为曲折的旷视科技,2019 年就正式向港交所提出申请,而后IPO之路频频受阻。好在最新消息是旷视在科创板的IPO申请已获上交所处理,给科创板密集撤单迹象提供了正向信号。
应当看到,AI 与医疗医药的结合还处在起步阶段,需要长期的资源投入,需要耐心,以知识图谱、自然语言处理和计算机视觉为主的医疗场景结合尚且如此,更高层级的生物计算难度有增无减。
在新兴产业的早期阶段,相较于走在前面,更重要的是树立旗帜,推动产业发展。这对于需要与产业紧密结合的 AI 技术来说尤其重要,而百度正在践行的这条路径,也很可能打开中国生物计算的新局面。
种种迹象表明,生物计算的发展进入到了全新阶段,令业界振奋的研究成果相继发表。据咨询机构 Frost&Sullivan 预计,到 2021 年,AI 将从全球医疗保健中产生 67 亿美元的收入,并且将保持高速增长,包括百度、谷歌等 AI 强企的积极布局,也说明生物计算正从实验室走向广阔产业。
2020 年 1 月,新冠疫情来袭,百度在一月底向全社会免费开放了线性时间算法 LinearFold,该算法可将新型冠状病毒的全基因组二级结构预测从 55 分钟缩短至 27 秒,提速 120 倍,节省了两个数量级的等待时间。5 月,百度推出全球首个 mRNA 疫苗基因序列创意算法 LinearDesIGn,最快 16 分钟完成 mRNA 疫苗序列创意。
简单来说,生物计算就是通过计算机来研究像是生酮质、DNA、RNA 等微小的生物活性物质,是一个随着信息技术发展应运而生的前沿领域。
事实上,在 AI 技术上取得突破式进展,在自动驾驶、生物计算等领域建设起平台的,主要还是谷歌、百度、微软等有着成熟业务条线,上市时间长,能够调用大量资源的科技公司。
学者尤瓦尔·赫拉利在《未来简史》的序章中提醒读者,人类有能力对抗瘟疫其实就是最近几十年才发生的事情,但人们无能为力。在这之前,流行病常常造成数千万人死亡,
而回到螺旋桨来看,不难发现,螺旋桨生物计算平台在技术先进与开源开放上,都与百度飞桨深度学习平台一脉相承。和 Apollo 自动驾驶等业务条线类似,螺旋桨同样是百度底层 AI 能力在生物计算领域的集成和延伸。
正如我们前面的分析,前沿技术的价值释放需要时间,而且也依赖于长期、高额的投入。百度、谷歌等企业对创新技术的投资,未来会逐渐被资本市场所认可,而究其根本,还是来自于新技术创造了巨大的社会价值。
如果后来没有拿着搜索引擎专利回国创立百度,平行时空里的李彦宏很可能成为了一名生物计算科学家。
不过另一家公司没有这么幸运了,曾经名噪一时的 AI 公司 Wave Computing 因核心产品不及预期、经营不善等问题,在去年 4 月提交了破产申请,正式宣告倒闭。
市盈率反映的是资本市场对企业的综合定价,百度在估值上「吃亏」的原因在于 AI 时代的技术落地尚未充分兑现,而在移动互联网时代,百度的「后进」使得资本市场更加谨慎。
为了更加深度推动并参与生命科学领域,2020 年 9 月,李彦宏牵头创立了「百图生科(BioMap)」公司,并且亲自出任董事长,BV 百度风投 CEO 刘维作为联合创始人,担任 CEO 一职。
然而即便如此,复杂的生命仍然在很大程度上是一个「黑箱」,仍然有许多疾病无法被治愈,而且即便有了各种先进诊疗手段,也没能遏制新冠在全球蔓延。
那么,百度的一系列「组合拳」,对其自身能产生什么价值?对我们理解「AI+ 生物计算」的未来又有着怎样的启示?
中金于 2020 年 12 月发布的一份研报指出,人工智能与生命科学的结合有望成为一条新兴的发展赛道。
由于 DNA、RNA 是生物遗传信息的载体,而由其指导生产出的各类生酮质是生命活动的基本零件,因此,搞清楚这些物质就等于是解开生命密码,对于医疗、医药领域有着不言自明的巨大价值。
AI 领域的一个现实情况是,许多 AI 专项公司因为对外的业务概念集中,单一叙事下享受到了较高的估值溢价,但是因为长期亏损使得这些公司在更加「务实」的二级市场被更加严苛的眼光审视。
算法产品的密集推出仅仅是「前哨」,做平台,做生态,吸引更多的学界、商界合作伙伴才是百度的意图所在。
以百度为例,百度前段时间发布的一季度财报实现营业收入 281.34 亿元人民币,其中百度核心业务一季度营收 204.83 亿元,同比增长 34%,占收入比重为 72.8%,目前百度核心业务的营收主要来自在线营销,由于占据了稳固的搜索与信息流生态位,可以源源不断的助推新业务成长,并且在线营销本身也受益于人工智能的加成。
拜科学技术发展所赐,人类对疾病的作用机理,以及药物和疫苗的研发都有了更加深入的理解,瘟疫不再被视作无法避免的自然灾害,无数人的生命被拯救。
而百度核心非推广收入的业务中,主要就是由人工智能、云计算相关业务构成,比如营销云、智能交通、自动驾驶、AI 芯片等等,此项收入在 2021 年一季度收入同比增速达到 70%,延续了高速增长的态势,李彦宏也在财报电话会上强调,随着人工智能的增长,「未来三年百度非推广收入将超过推广收入」。
2020 年 12 月,百度正式对外发布了 PaddleHelix 螺旋桨生物计算平台,该平台依托飞桨深度学习平台和百度智能云,简单来说就是百度提供了一整套基于 AI 的算法工具、算力设施和场景化服务,帮助 AI 开发者和生物医药研究人员调用这些能力,开展相关的研究工作。
根据中金研报,生物计算的研究成果,对于农作物增产、以及材料领域降解塑料的「生物酶」,都有望带来颠覆式改变,显然,这背后所涉及的,都将是万亿级的产业机会。
整体来看,百度在生物计算领域的「组合拳」首先是建立在其 AI 能力的基础上,进而,百度提供产品和服务接口,扩大「产业朋友圈」,并且招揽人才、建设生态联盟。
从公司定位上看,百图生科是中国首家生物计算驱动的生命科学平台公司,目前已经宣布了两项人才招募计划,还在今年 5 月发布了免疫图谱卓越计划并进行了联盟签约,与药物研发、计算药物创意平台、以及大型跨国药企等 30 余家首批生态伙伴进行了签约,共同进行免疫图谱绘制,为癌症、自免、衰老等复杂生命过程的探索提供助力。
同年 10 月,诺贝尔化学奖授予了 Charpentier 以及 Doudna 等科学家开发的基因编辑技术 CRISPR,这项技术问世至今不到十年,发展极为迅速,而其与机器学习的结合也是当下学界最热门的研究领域之一。
更不必说,每一个病例背后都是一条鲜活的生命,攻克顽疾,就是在拯救生命,以及它们背后千千万万的家庭。
能看到的是,百度在 AI 战略指引下,一直在加码研发投入,年报数据显示,2020 年百度核心研发费用占收入比例达到 21.4%,位于中国大型科技公司前列。这些主要投向人工智能研发的钱,本质是对未来的投资,但在财报体系中却是费用。
举例来说,一款新药的研发普遍要耗时十年,平均研发成本在 20 亿美元左右,而通过引入 AI 技术,将极大的节约时间,降低成本,比如借助集成在螺旋桨平台的 DTI 和 ADMET 算法,研究人员可以在短时间就完成药物分子的活性预测和成药性预测,大大缩短临床前药物研发的周期。
2018 年 4 月,百度研究院开始加码生物计算并在 2019 年陆续发表了 LinearFold(全球最快速的 RNA 结构预测算法)、LinearPartition(全球最快速的 RNA 配分方程和碱基对概率预测算法)和 LinearDesIGn(全球首个 mRNA 疫苗不稳定性解决方案)。hahabet手机版网页运动