2025-10-19 11:52:08
这里记录值得分享的生信相关内容,每半月发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
Source: Mitalipov Laboratory
“一稿多投”一直被认为是不端的行为,但这个“规矩”是在纸质时代信息沟通不畅的情况下制定的,近年来有关取消这一观念的声音已振聋发聩!
国际顶级期刊Nature 职业专栏(Nature Career Column)发表文章指出禁止“一稿多投”不仅延误了科研工作的进程,还阻碍了科学信息的快速传播,学术期刊不应利用这项不合理的政策囤积投稿,“是时候废除‘一稿多投’禁令了。”
@ShixiangWang
:AI和互联网极快地加速了学术工作的宣发,传统的机制越来越无法适用当前快节奏的时代。其实从数学/AI等普遍以预印本发表早有端倪,现在越来越多预印本的使用也会更快地加速这个过程。
1、Science丨破解FOXA1突变“双重人格”,前列腺癌治疗需“分型而治”
该研究首次系统性地揭示了FOXA1基因的两类功能性突变如何分别驱动前列腺癌的两种“恶性进化路径”,为前列腺癌的异质性提供了机制解释,并为基于突变分类的个体化治疗奠定基础。
2、Nature | 三发:斯坦福张元豪等揭秘癌症中的ecDNA,影响较既往认知更大、遗传方式突破基本定律
发表在《自然》杂志上的三篇论文指出,染色体外DNA(ecDNA)在多癌种中有广泛分布、流行率较既往认知高得多;在分裂过程中,多个ecDNA聚集形成ecDNA中心,以保证能连接在一起发挥作用的ecDNA在细胞分裂时被分配到同一个子细胞中继续发挥作用;ecDNA由于大量转录,会出现内源性DNA损伤,故很可能含有ecDNA的癌细胞高度依赖多复制应激调节机制以避免DNA损伤水平过高。作者认为ecDNA癌细胞通过检查点激酶1(CHK1)来管理DNA损伤,CHK1抑制剂很有可能触发ecDNA癌细胞死亡。实验结果表明在FGFR2扩增的SNU16胃癌异种移植模型中,CHK1抑制剂BBI-2779联合FGFR抑制剂infigratinib能有效避免耐药性的产生。
文章链接:
Bailey, C., Pich, O., Thol, K. et al. Origins and impact of extrachromosomal DNA. Nature 635, 193–200 (2024). https://www.nature.com/articles/s41586-024-08107-3
Hung, K.L., Jones, M.G., Wong, I.TL. et al. Coordinated inheritance of extrachromosomal DNAs in cancer cells.Nature 635, 201–209 (2024). https://www.nature.com/articles/s41586-024-07861-8
Tang, J., Weiser, N.E., Wang, G. et al. Enhancing transcription–replication conflict targets ecDNA-positive cancers. Nature 635, 210–218 (2024). https://www.nature.com/articles/s41586-024-07802-5
3、Nature medicine | 基于区块链的临床和遗传数据共享框架助力精准医学应用
精准医学旨在根据患者的遗传、生理和环境特征,为其提供个性化的医疗方案。实现这一目标的关键在于整合临床和组学数据,以深入理解遗传背景下的临床观察结果。然而,现有的数据共享系统面临诸多挑战,例如不同数据类型的整合、互操作性、安全性以及数据所有权等问题。区块链技术具有安全、不可篡改和去中心化的特性,为解决这些挑战提供了潜在的解决方案。
基于这个概念,研究人员开发一个基于区块链技术的去中心化数据共享平台(PrecisionChain),以统一临床和遗传数据的存储、检索和分析,促进精准医学应用。PrecisionChain 提供了一个安全、可扩展的去中心化框架,用于整合临床和遗传数据,促进精准医学应用。该平台能够高效索引多模态数据、支持多模态查询和分析,并有效解决区块链技术面临的挑战。
本文介绍了统计学中通过非劣效性检验(Non-Inferiority)以及等效性检验(Equivalence)进行样本估计的原理方法,并提供相关案例。
5、ggdendroplot:在R语言中使用ggplot2绘制定制树状图
ggdendroplot可在 ggplot2中绘制高度可修改的树状图。树状图可以轻松修改并添加到现有的 ggplot 对象中。
Git 是现代软件开发过程中必不可少的版本控制工具。良好的 Commit Message 可以帮助开发人员更好地了解代码的历史、原因以及改动的目的。本文将介绍为什么要编写高质量的 Commit Message,如何编写有效的 Commit Message,以及有哪些工具可以帮助我们编写好的 Commit Message。
该推文从9层境界帮助读者深层次理解EM算法,解释了EM算法的重要性。
8、AI大模型工具 | scBERT:对scRNA-seq数据进行细胞注释
目前单细胞类型注释方法大概可以分为三类:使用marker基因注释、基于相关性的方法注释,以及通过监督分类注释。其中最后一种是遵循机器学习中的经典范式,即识别基因表达谱中的模式,然后将标签从标记数据集转移到未标记数据集。由于模型容量有限,大多数方法需要在将数据输入分类器之前进行高度可变基因(highly variable gene,HVG)选择和降维。然而HVG在不同批次和数据集中存在差异,降维可能会丢失高维信息以及基因水平的独立可解释性。HVG选择和降维的参数设置未能达成共识,造成性能评估的人为偏差。容易忽略稀有细胞类型关键基因以及基因之间相互作用信息。
为此,研究人员开发了scBERT模型,用于scRNA-seq数据的细胞注释。通过预训练和微调范式,验证了在大规模未标记scRNA-seq数据上应用自监督学习的能力,以提高模型的泛化能力和克服批次效应。广泛的基准测试表明,scBERT能够提供稳健且准确的细胞类型注释,并具有基因水平的可解释性。
10、genomepy | 一行命令下载最新基因组(FASTA)和注释(GTF/GFF)
genomepy 是一个功能强大的 Python 工具,旨在简化和自动化基因组数据的查找、下载、管理和预处理流程,让您能更专注于核心的生物学问题。
安装:
conda install -c conda-forge -c bioconda 'genomepy>=0.15'
11、硬核生物信息学系列汇总
「观科研」公众号生信相关推文汇总,涉及R语言、Bulk RNA测序、单细胞RNA测序、代谢组学等。
棒棒图常用于展示位点突变情况,本文介绍了10个相关的工具。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳@yanbin85
- 严彬@MadDERt
- 王章宇这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-09-21 10:34:04
这里记录值得分享的生信相关内容,每半月发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
高等教育规模整体扩大,加上查重、AI率等检查指标盛行,大学生想要顺顺利利完成毕业论文越来越难。大学生主要因为学术训练不够,九成本科毕业生觉得写毕业论文有难度。本科论文的必要性,讨论其实由来已久,部分老师和学生认为应该取消本科毕业论文要求。
1、Nature | 颉伟课题组揭示哺乳动物早期胚胎中染色质高级结构重建与胚胎超转录机制以及相互促进关系
文章系统研究了小鼠早期胚胎中染色质高级结构逐步建立过程的调控机制,并揭示了其与一种特殊“超转录”状态之间的双向作用,超活跃的转录活动与染色质高级结构相互促进,共同推动胚胎发育基因程序。此项工作为理解转录与三维基因组结构之间的耦合关系提供了新的思路。
2、Cell |癌症免疫大数据平台CIDE:揭示基于分泌蛋白的新免疫疗法
文章自主研发了癌症免疫大数据平台CIDE,首次系统解析了人体中1900余种编码分泌蛋白的基因在肿瘤免疫微环境中的调控作用。其中酰氧酰基水解酶(AOAH)能特异性清除免疫抑制性卵磷脂及其氧化产物,犹如“化雪春风”般解除肿瘤免疫抑制,显著增强T细胞受体识别弱抗原的能力并保护树突状细胞的抗原递呈和共刺激功能。
3、Nature | 填补92%组装缺口!65个近乎完整人类基因组发表,深度解析复杂遗传变异
文章通过对来自全球28个人群的65个多样性个体(主要来自1KGP)进行深度测序,成功构建了130个高度连续的单倍型基因组,填补了先前92%的基因组组装缺口,39%的染色体达到端粒到端粒(T2T)完整状态。
该研究对所有关于父母教育对新生儿、婴儿和 5 岁以下儿童死亡率影响的现有研究进行综合性全球系统评价和荟萃分析,发现母亲和父亲教育的增加均显示出与 5 岁以下儿童死亡率降低相关的剂量反应关系,其中母亲教育成为更强的预测因素。
推文介绍了机器学习中动态预测的优势、挑战和应用,并使用合成数据集介绍了代码实现。
6、焦虑的反面是具体:用3年AI实践和你分享这份AI科研心得指南
推文作者结合三年 AI 科研实践经历,讲述了自己如何从把 AI 当作写作和资料整理工具,逐渐过渡到科研中的思维伙伴。作者总结了三种与 AI 合作的姿态,提出用金字塔方法评价科研工具,并分享了 10 条可操作的行动建议,帮助科研工作者将焦虑转化为具体的实践与进步。
7、Paper2Poster:一键生成顶会级学术Poster,再也不用为赶会熬夜做PPT啦。
Paper2Poster是一种面向科学论文的多模式海报自动化生成方法,主要解决了如何根据论文创建海报以及如何评估海报。
推文介绍了PSweight包的主要功能、原理以及函数,并通过NCDS数据案例讲解PSweight包。
推文利用 python 和 deepseek 对自己依靠 quarto 构建的个人网站上的文章进行了全部的自动翻译,并讲述了实现方法。
10、25个经典蛋白质组学数据库为Astral-DIA添砖加瓦!
推文系统梳理了 25 个经典蛋白质组学数据库,包括 UniProt、GO、KEGG、STRING、PhosphoSitePlus、PDB 等,方便科研人员进行数据分析与深入探索。
推文详细介绍了5个功能强大的Github开源项目。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-09-08 10:28:27
2025年已发布 5 期,涵盖生物信息学前沿研究、学术动态、工具资源等内容。
月份 | 发布期数 | 主要话题 |
---|---|---|
九月 | 1期 | 科研经费管理 |
八月 | 2期 | 高等教育、生物医学 |
七月 | 2期 | 专业设置、学术评价 |
2025-09-07 18:53:23
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
The Colors of Heredity-遗传的色彩
@kkjtmac 理想的研究是为探索未知,经费是必要的支撑。但现实中,当经费申请、预算执行和量化考核成为指挥棒时,科研便有异化为“为烧钱而研究”的风险。回归初心,让经费真正服务于好奇心和重大问题,而非沦为追逐指标的游戏,至关重要。
1、Nature | 陈鹏/伊成器建立RNA”暗码”,升级生命语言
北京大学陈鹏团队和伊成器团队通过RNA假尿嘧啶Ψ修饰的定点编程,创造了三个全新的“ΨCodon”密码子,并筛选出能特异性解码这些密码子的tRNA变体,实现了在蛋白质特定位点精准插入非天然氨基酸,从而操控蛋白质功能。与传统DNA密码子拓展技术相比,该RNA密码子拓展技术(RCE)具有更高的全局特异性和正交性,显著降低了脱靶效应,为精准蛋白质工程、合成生物学和生物医学研究提供了新的工具平台,也为设计人工合成生物体提供了新的编解码元件。
2、Nature|癌症免疫疗法新突破:1种肠道细菌让PD-1治疗效果飙升
Nature上这篇研究成功从对PD-1阻断疗法有响应的患者粪便中分离出一种此前未被详细描述的新型细菌菌株YB328,并首次详细揭示了其通过特异性激活树突状细胞(DCs)来增强抗肿瘤免疫的分子和细胞机制。
3、Nature|Y染色体缺失致男性癌症高风险,发现抗衰老与抗癌新靶点
该研究整合了4000余例男性癌症样本、逾100万个肿瘤微环境中细胞的单细胞转录组数据,并借助CRISPR小鼠模型和多平台组学,全面探索了Y染色体缺失的起源、传播路径及其临床意义。
这篇文章主要讨论了PE150测序模式下插入片段大小的选择问题:插入片段大小会影响测序结果的覆盖范围和质量。当插入片段大于300bp时,两端生成的150bp的reads无法覆盖中间区域;当插入片段在150bp到300bp之间时,两端的reads会有重叠区域,覆盖完整;而当插入片段小于150bp时,测序仪会记录无效碱基。文章建议常规文库构建的插入片段主峰在300bp到500bp之间,特殊文库如cfDNA和扩增子建库等有不同要求。插入片段的误差在几十bp范围内是可接受的,但严重偏离则意味着建库失败。插入片段过短会导致测序读到接头,造成数据浪费;过长则会降低成簇效率和测序质量。
这篇文章探讨了科研工作者实现财富自由的途径。在经济转型期,科研人员面临机遇与挑战。文章提出了三种成果转化方式:一是自己创办公司,将技术产业化,但面临融资、管理等难题;二是与人合伙,通过技术入股成立初创公司,需找到靠谱合伙人;三是通过专利许可或技术转让,但可能面临被压价风险。作者鼓励科研人员走出舒适圈,利用国家政策支持,将科技成果转化为生产力,实现自身价值。
6、P value、adjust.P、qvalue、FDR有何异同
文章介绍了P值、adjust.P、qvalue、FDR的概念及区别。P值是在原假设成立时观察到当前结果或更极端结果的概率。校正P值是为了解决多重比较问题,降低犯I类错误的概率。校正方法包括Bonferroni校正、FDR校正等,其中FDR是常用方法,通过控制假阳性比例来校正P值。qvalue是校正后的P值,用于控制整体FDR。这些都是生信分析中最基础常见的概念,推荐学习或者回顾。
这篇文章介绍了GPU网络的基础知识,特别是针对大规模训练语言模型(LLMs)的场景。文章指出,单个GPU训练大型模型耗时过长,因此需要大量GPU协同工作。这些GPU需要通过网络连接来共享进度和结果。文章讨论了全网状网络(full mesh)的不切实际性,因为需要过多的端口和电缆。接着介绍了使用网络交换机来简化连接,但指出单一的巨大交换机也不可行,因此需要分层交换架构。文章还讨论了水平扩展(scaling out)和垂直扩展(scaling up)的概念,以及它们在GPU集群中的应用。此外,文章还提到了GPU之间的通信方式,包括内部节点(intra-node)和节点间(inter-node)通信,并解释了为什么内部节点通信更快。最后,文章简要介绍了神经网络训练中的通信挑战,特别是all-reduce通信的重要性。
IOBR 2.0是一个用于肿瘤微环境和免疫特征分析的工具。IOBR 2.0 提供了六个模块,包括数据预处理、微环境解析、交互作用分析等。它整合了8种免疫浸润分析算法,如CIBERSORT、TIMER等,并提供了323个特征基因集。IOBR 2.0 支持多种数据打分和可视化方法,适用于多组学数据。
9、scitable包 | 一键生成彩色(危险分层 Risk Stratification)的列线图
scitable包是一个强大的R包,用于生成彩色列线图(Nomogram),可用于预测疾病风险。它基于回归模型,将多个变量的值转换为直观的视图。该包支持多种自定义功能,如更改颜色、字体、添加风险分层等。通过简单的函数调用,可以快速生成高质量的列线图,适用于临床研究和生物统计分析。
10、PPI-ID | 让蛋白互作预测更精准高效的一款轻量化工具
PPI-ID 专为简化和优化 PPI 预测流程而设计,通过整合蛋白结构域(Domain)与短线性基序(SLiM)映射,极大提高了预测的效率与可信度。
「陈巍学基因」累计大量的生物技术/生物信息学知识视频图文分享,非常专业细致,推荐大家学习。PS:可能会过期,建议关注「陈巍学基因」公众号。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-08-22 17:25:00
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
在《人物》报道中,同济大学教育现代化研究中心研究员李俊在观察中发现,过去大学时期是学生高考后开始自我探索、独立生活的起步阶段,但现在大学校园里几乎只剩下两种人——一种是习惯性延续着高中阶段学习方式、目标极为明确、拼命卷自己的学生,另一种则是高考后完全放松、无所事事的人。他提出疑问:为什么大学越来越像高中了?
1.Science | 微软公司开源发布生成式AI模型BioEmu,可快速、精准预测蛋白质多种构象状态
近日,微软研究院AI for Science团队开发了一种生成式深度学习模型BioEmu,能够以前所未有的效率和精度模拟蛋白质的构象变化。BioEmu能够在一个GPU小时内生成数千种构象状态,其速度显著优于传统MD模拟。此外,通过结合大量的蛋白质结构数据、超过200毫秒的MD模拟数据以及实验测量的蛋白质稳定性数据,BioEmu能以约1 kcal/mol的相对自由能误差准确预测蛋白质的平衡态构象。
参考文献:
2.Nat.Commun| 人工智能计算方法CGMega解析癌症基因模块
文章提出基于可解释图注意力机制的计算框架CGMega,实现了癌症基因模块的辨识与解析。
3.Nature Machine Intelligence | 深度学习框架助力基因组数据提升肿瘤治疗
文章提出了一种解释性深度学习框架,称为ResGitDR,通过整合基因组数据和细胞状态,显著提高了癌症药物反应预测的准确性。
4.2篇《自然》连发!樊荣/唐力团队揭示Type-2免疫增强肿瘤免疫疗法的重要机制
北京时间2024年9月25日23时,Nature同期连发两篇重磅研究,揭示了Type-2免疫在维持经CAR-T治疗的B-ALL患者超 8年无癌临床反应的关键作用,以及Type-2细胞因子Fc–IL-4协同Type-1免疫疗法高效、持久清除多种实体肿瘤的内在免疫学和分子生物学机制。这两项研究分别聚焦患者长期临床追踪(超10年)和临床前机理研究,得出了一致且相互支持的结论,即Type-2免疫可能在维持长效持久的抗癌免疫反应中起关键作用。这一发现揭示了Type-2免疫反应在肿瘤免疫中的未知功能,挑战了传统免疫学关于Type-2免疫应答在肿瘤免疫中负面作用的认知,并可能推动未来肿瘤免疫治疗设计的范式转变。
-论文链接: 1. https://www.nature.com/articles/s41586-024-07762-w 2. https://www.nature.com/articles/s41586-024-07962-4
因果森林(Causal Forest)是一种用于因果推断的机器学习方法。它基于随机森林(Random Forest)算法,但专门设计用于估计处理效应,即不同处理(或干预)对结果的影响。该文介绍因果森林模型在R语言中的运用。
6.全球AI for Science领域顶尖科学家李子青教授出任百图生科首席科学家
BioMap 百图生科宣布,全球人工智能领域的顶尖专家、西湖大学人工智能讲席教授——李子青教授出任百图生科首席科学家(AI大模型)。李教授将指导和带领公司多个AI大模型项目的研发与应用,参与公司整体技术战略的规划和执行,为公司在“AI for Life Science”领域的前沿创新提供战略支持。
7.英国生物银行与牛津纳米孔达成合作,构筑五万人表观遗传图谱
牛津纳米孔公司的突破性基因测序技术将对英国生物银行的 50,000 个样本进行分析,以创建全球首个“表观遗传图谱”。
10.podscript | 使用语言和语音转文字模型生成播客字幕
本书的目标是帮助你编写更好的R代码。
这是一个包含19个医疗数据集的数据包,用于借助R语言教授可重复的医学研究相关知识。这个数据包对于任何向医疗专业人员(包括医生、护士、药剂师、实习生和学生)教授R语言的人来说都非常有用。这些数据集涵盖范围广泛,既有詹姆斯·林德1757年的坏血病数据集的重构版本、1948年原始的链霉素治疗肺结核试验数据,也有2012年吲哚美辛预防ERCP术后胰腺炎的随机对照试验数据,还有关于SARS-CoV2检测结果的队列数据等。许多数据集来自美国统计协会的TSHS(健康科学统计学教学)资源门户,该门户由马萨诸塞大学的卡罗尔·比奇洛维护(已获得许可)。开发版本中越来越多的数据集是由弗兰克·哈雷尔从其网站慷慨捐赠的,这些数据集目前仅存在于GitHub上的开发版本包中,预计将于2023年6月纳入CRAN。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)
2025-08-03 00:50:24
这里记录值得分享的生信相关内容,每半月发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
克劳斯小体(Krause corpuscles)是位于皮肤下紧包球体内的神经末梢,150多年前在人类生殖器中首次被发现。这种结构很像人类手指和双手上的触摸激活小体——这些小体会在皮肤穿过纹理表面时对振动做出反应。
Ginty与合作者利用各种机械和电刺激激活了雄性和雌性小鼠体内的克劳斯小体。这些神经元会对40-80赫兹范围内的低频振动放电。团队还发现,雄性和雌性小鼠的生殖器包含相等数量的小体,这些小体会在小鼠发育过程中随器官生长在空间上分散开来。基因改造后缺少克劳斯小体的小鼠无法正常交配,说明这个结构对于性的必要性。进一步研究这些神经细胞能帮助治疗勃起功能障碍和阴道疼痛这类疾病。
@ShixiangWang
- 人是“有机”的机械装置,有时候对人体的运行图景感觉非常神秘和魔幻。从对世界的探索中,我们开发了多种科技技术来延展我们对世界的感知和反应,但对于机体内的这些秘密却感知和传播的极少。
1、Cell | 让人人都能建立虚拟细胞实验室!科学家创建“细胞语法”,用人类语言预测细胞行为
文章创建了一套革命性的“细胞语法”,只需使用简单的人类自然语言描述,就能模拟癌细胞转移、免疫细胞作战甚至大脑发育,让没有编程背景的生物学家也能构建虚拟细胞实验室,从而加速癌症、神经科学等领域的突破。
2、Genome Biology|综合比较评估24种变异效应预测方法
本研究旨在利用未被用于预测方法训练的人群水平基因型和表型队列数据,对现有的计算变异效应预测方法进行无偏评估,并确定哪种预测方法最能有效地推断人类性状。
3、Nature Protocols | 使用clusterProfiler刻画多组学数据研究方案
文章将clusterProfiler应用到包括空间转录组、蛋白质组和表观基因组在内的多种组学数据。
推文通过构建测试数据,将分位数回归计算与普通OLS回归进行比较,讲解分位数回归的意义及用法。
git 是当代软件编码记录的核心基础工具,其主要通过构建一个隐藏的.git目录进行控制和管理,本文通过图文汇总形式揭秘。
Bash脚本是Unix和Linux系统管理的基石,它提供了强大的工具来自动化重复的任务、简化工作流和处理复杂的操作。对于那些已经熟悉基本脚本的人来说,深入研究先进的技术可以解锁新的效率和能力水平。这篇文章将探讨Bash中的高级shell脚本技术,重点是脚本优化、健壮的错误处理和自动化复杂的系统管理任务。
8、Text to Logo & Favicon | 文本构造图标
9、DrugCLIP | 24小时内完成对1万个人类蛋白与5亿小分子的虚拟筛选任务
清华大学人工智能研究院与生命科学学院联合发布新成果——DrugCLIP,一项结合对比学习与稠密检索(dense retrieval)的AI系统,在24小时内完成对1万余个人类蛋白与5亿小分子的虚拟筛选任务,速度比传统方法快10万倍。更令人兴奋的是,该系统不仅在两个精神疾病靶点(5HT2AR和NET)中筛选出多个高亲和力分子,还首次建立了“基因组级”虚拟筛选数据库,面向全球开放,开启“后AlphaFold”时代的药物发现新范式。
10、DNA学习中心 DNA from the Beginning
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)@kongjianyang
(空间阳)@donghongyu2020
(董弘禹)@DrRobinLuo
(罗鹏)@Wangcy-rachel
- 王春阳@zoe3251
- 舒晨阳这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)