《科创板日报》3月7日讯(记者 金小莫)在需求栏中输入对目标蛋白质的描述参数,比如序列长度、结构对称性、目标功能、结合配体结构、化学计量等;点击“运行任务”键;很快,电脑屏幕上就显示出了符合参数要求的蛋白质三维结构。
这是记者在天壤XLab看到的相关应用。
2022年10月,天壤XLab上线了蛋白质自由设计平台xCREATOR,面向高校师生免费开放,不足半年,该平台已累积有五六百用户。日前,《科创板日报》记者从天壤XLab处进一步了解到,今年2月下旬,团队自主研发的蛋白质扩散模型也已正式上线。
(资料图片)
支撑这些平台的技术就是蛋白质结构的自动生成技术,后者也是ChatGPT的核心技术之一。另有迹象表明,自动生成技术在生命科学领域的应用正在逐渐增多:
今年2月,科创板合成生物学上市公司凯赛生物宣布领投AI蛋白质设计平台公司分子之心的新一轮战略投资;同在2月,初创企业赛得康宣布完成了数千万元的种子轮融资,AI设计+蛋白模块是企业的关键词。
“其实,ChatGPT所依托的AI生成技术并非新技术,很多公司都已经有所积累并陆续开始应用了。之前有个语言模型BERT就被用于蛋白质生成了,取得了不错的成果。”一家行业企业对记者表示,只不过,当ChatGPT走热之后,AI生成技术在生命科学领域的应用也逐渐走进了公众的视野。
记者注意到,当互联网科技向AI迭代升级后,很快,AI的应用就从TMT涌向了生物医药,AI+药物发现一度成为一级市场的投资热词;类似的情况,会不会也发生在ChatGPT+药物发现上呢?
▌氨基酸恰类似于大数据
记者了解到,自动生成技术之所以可应用到蛋白质的发现上,有这样的科学逻辑支撑:
蛋白质是由氨基酸通过不同的排列组合聚合而成,每个蛋白质的三维结构又决定了它的功能作用。在算法人的眼中,氨基酸就类似于数据、蛋白质的三维结构类似于图像,通过数据及图像的不同排列组合训练,AI就能实现自生成。
在业内,这一逻辑也被称为AIGP,即AI Generated Protein(AI生成蛋白质)。
在天壤XLab,记者看到了相关应用:
在需求栏中输入对目标蛋白质的描述参数,比如序列长度、结构对称性、目标功能、结合配体结构、化学计量等;点击“运行任务”键;很快,电脑屏幕上就显示出了符合参数要求的蛋白质三维结构。
去年10月,具备该功能的xCREATOR工作台正式上线,面向高校师生免费开放;今年2月下旬,团队自主研发的蛋白质扩散模型也正式上线。
“我们还附加了一系列设计蛋白质的分析功能,可以对各类由算法自动生成的蛋白质结构进行打分,分数越高表示该自动生成的蛋白质结构的可实现性越高。”天壤XLab实验室负责人苗洪江博士介绍称。
在ChatGPT中,需要人工对数据进行标注、打分,以此来训练算法更会聊天;AIGP也是类似的逻辑,但不同的是,如果科研人员要想知道某一由算法自动生成的蛋白质,其可实现性到底高不高,还需要通过进一步的湿实验来验证,因此,AIGP的技术壁垒也就更高。
为了降低这一技术门槛,引入打分模型算法是很多企业的选择。
前述行业企业对《科创板日报》记者进一步解释了生成算法与打分算法的工作逻辑:首先,由生成模型算法生成蛋白质;其次,由人工对经打分模型筛选出的、得分较高的蛋白质,再进行实验验证,并反馈给打分模型算法。“二者就像老顽童的左右两手互搏,通过不断增强学习,来提高算法的质量。”
▌探索大分子宇宙
有了AIGP,对于科研人员来说,最大的获益无疑是加速了研发的进展。
“以100个氨基酸长度的蛋白质为例,其序列的排列组合有高达20^100=1.3×10^130种可能!相比之下,人类可观测宇宙总原子数量仅有10^82,以人力来测试、构想这样庞大的蛋白质空间可以说是不可能完成的任务。”苗洪江称,如今AI模型能够精准定位到符合要求的蛋白质再由研发人员进行实验检验,蛋白质设计效率前所未有的提升使其终于可以走进产业应用中去。
更重要的是,过去基于偶然性的开发工作也极大限制了人类对于蛋白质的开发,人类已知的天然蛋白质数量为10^15,而潜在的从头设计蛋白质数量远超于已知天然蛋白质。
以人体内的蛋白质来说,“目前大多数人类蛋白质功能研究都聚焦于约5000种研究较多的人类蛋白质,而人体内还存在着一个巨大的蛋白质世界。事实上,这些功能未知的蛋白质可能掌握着打开解决人类重大疾病的钥匙,如癌症、阿尔兹海默症以及多种罕见病。”苗博士解释称。
除生命科学外,新材料、新能源和食品等领域对功能蛋白质也存有巨大的需求。“整个蛋白质世界还拥有巨大的潜在探索空间,蕴藏着无穷无尽的资源,具有极大应用价值!”天壤CEO薛贵荣博士表示,蛋白质领域的ChatGPT会成为像水、电、煤一样成为工业发展支撑,开辟出全新的科学时代。
《科创板日报》记者进一步了解到,如何获取行业数据、如何通过实验验证来对数据进行标注进而得到高质量的反馈数据仍然是限制AIGP大爆发的主要拦路虎。基于此,开源共享仍是目前行业企业们的主要选择。
天天新资讯:生物版ChatGPT来了!可“一键生成”蛋白质 应用多以开源为主
《科创板日报》3月7日讯(记者金小莫)在需求栏中输入对目标蛋白质的描述参数,比如序列长度、结构对称性、目标功能、结合配体结构、化...
坑完苹果,再坑富士康:印度制造业还有没有未来?
印度制造未来的路还很长,很难。正解局出品前两天,有消息说,富士康要去印度建一个超级工厂。起因是,上周,富士康董事长刘扬伟专门去...
天天头条:广西龙胜县举办一年一度“花炮节”
广西龙胜县举办一年一度“花炮节”3月6日,广西桂林市龙胜各族自治县三门镇同烈村,瑶族民众参加“花炮巡游”活动。潘志祥摄3月6日,广...
从医美到护肤品,华熙生物终究不是万能的
上市之初,作为市场上颇为稀缺的医美产品股,华熙生物受到了市场热捧,市值一度超过1500亿元。在医美产品业务颓势尚未完全显露之前,华熙生物
焦点热议:悦普集团冲刺上市:应收款项规模较高,实控人林悦为大专学历
近日,上海悦普广告集团股份有限公司(下称“悦普集团”)递交招股书,准备在上海证券交易所主板上市。本次冲刺上市,悦普集团计划募资7...
天天视讯!10年净利首降 海康威视新老故事怎么讲?
深度独立穿透价值自证依然漫漫!作者:李欢编辑:徐勇风品:蒙多来源:首财——首条财经研究院作为AI商业化落地的主赛道,安防市场近年...
全球消息!拼多多跨境电商业务将登陆大洋洲 助力中国制造业开拓全球市场
记者6日获悉,拼多多跨境电商业务...
当前速讯:专访:中国扩大开放为外资企业发展注入动力——访霍尼韦尔中国总裁余锋
总部设在美国的世界500强企业霍尼...
全球报道:通讯:中国运输技术、产品和服务闪耀南美展会
在2日闭幕的南美多式联运展上,中...
全球热文:全国人大代表张乃文:创新金融工具 拓宽制造业绿色转型融资渠道
今年全国两会期间,全国人大代表、...
全球快消息!甘肃省公航旅集团成功发行5亿元短期融资券
在2月27日成功发行5亿元中期票据后...
当前观点:俄罗斯失业率降至3.6%
据俄罗斯媒体报道,2023年1月俄全...
当前讯息:赛拉弗全球发布最新N型TOPCon系列组件
近日,太阳能产品制造商赛拉弗能...
今日关注:第二届广东省产教融合大会在广州顺利举行
2月24日,为贯彻落实科教兴国战略...
天天微资讯!聚焦研发创新及应用落地 2023全球物流技术大会在琼召开
2023全球物流技术大会于3月1日至3...
【天天新要闻】尼日利亚最高法院下令停止纸币更换政策
尼日利亚最高法院周五裁定,尼日利...
天天实时:俄罗斯名义月平均工资增长12.6%
俄罗斯统计局数字显示,2022年俄罗...
津巴布韦2月通胀率回落至-1.6%
津巴布韦国家统计局3月3日表示,该...
南非2月份PMI回升至50.5
标准普尔全球公布的最新数据报告显...
全球微资讯!肯尼亚2月份PMI跌至46.6
标准普尔全球公布的最新数据报告显...
当前快讯:外媒:看好中国市场潜力 百威计划扩大在华业务
百威亚太控股有限公司(百威亚太)...
焦点速讯:北大师生眼中的厉以宁:“只计耕耘莫问收”
题:北大师生眼中的厉以宁:“只计...
环球观速讯丨中国预制菜行业数据分析:66.6%男性消费者会选择社区团购预制菜
中国餐饮市场规模庞大,整个行业原...
全球速读:京东重启低价策略,“百亿补贴”会是对抗拼多多的良药吗?
《科创板日报》3月6日讯(记者黄心...
天天热点评!外贸订单暴跌,制造业失守,背后的真正原因到底是什么?
最近一段时间,大家讨论最多的一个...