大电竞YAYA离职了吗

  • 使用小提琴图可视化目的基因并计算显著性

新闻动态

你的位置:大电竞YAYA离职了吗 > 新闻动态 >

使用小提琴图可视化目的基因并计算显著性

发布日期:2025-07-06 00:24    点击次数:146

前情回顾

在这个月的前几期推文中,主要基于单细胞数据使用小提琴图可视化marker基因进行了整理:

VlnPlot结果及常用参数浅析

基于VlnPlot参数及ggplot2美化小提琴图

也有一期答读者问——小提琴图有点无图是何缘由?

这期就一起来学习一下画目的基因的小提琴图并计算显著性!

小提琴图可视化并计算显著性用途

在单细胞数据分析中,通过小提琴图可视化和显著性计算可以帮助研究者直观且统计地评估目的基因在不同细胞群体中的表达差异

展示基因在不同细胞群体的表达分布:小提琴图可以直观地展示基因在各个细胞亚群中的表达水平和分布情况。

小提琴图能够反映不同群体中表达的中位数、四分位数及表达值的变化范围。特别是在复杂的细胞亚群中,这种分布展示非常有助于发现基因的差异性表达。

确定基因在不同亚群中的特异性表达:通过显著性计算可以明确目的基因是否在特定细胞亚群中显著表达。

例如,通过t检验或非参数检验(如Wilcoxon检验)来比较不同亚群间的表达水平,帮助筛选出与特定功能或病理状态相关的细胞群体。

为后续功能研究提供线索:显著性差异的基因表达通常可以看到基因可能在不同细胞群体的生物功能或疾病过程中起关键作用。

所以当我们需要查看单细胞不同分组,或者不同细胞亚群中某个目标基因的表达情况并且比较的时候,就可以计算一下显著性

基于小提琴图可视化目标基因

还是以pbmc数据为例,展示NKG7基因在不同细胞亚群中的表达情况,计算并展示不同分组间的显著性

载入需要的数据
#给亚群命名new.cluster.ids <- c("Naive CD4 T", "CD14+ Mono", "Memory CD4 T",                     "B", "CD8 T","FCGR3A+ Mono", "NK", "DC", "Platelet")names(new.cluster.ids) <- levels(pbmc)# 修改Idents中分群编号为细胞类型pbmc <- RenameIdents(pbmc, new.cluster.ids)DimPlot(pbmc, reduction = "umap", label = TRUE,          repel = T,pt.size = 0.5) + NoLegend()pbmc$cluster_by_counts=Idents(pbmc)pbmc$celltype=Idents(pbmc)#计算marker基因pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25,  logfc.threshold = 0.25, verbose = FALSE)top5 = pbmc.markers %>% group_by(cluster) %>% top_n(n = 5, wt = avg_log2FC)g = unique(top5$gene)
可视化NKG7在不同分群表达情况
# 使用VlnPlot生成NKG7的分组小提琴图,并去掉图例p <- VlnPlot(object = pbmc, features = 'NKG7',  pt.size = 0) +  NoLegend() +  theme(axis.text.x = element_text(angle = 90, hjust = 1))

图片

从小提琴图中可以看到NKG7基因在"CD8 T"以及"NK"中表达较高, 在"FCGR3A+ Mono"和"DC"中表达也较其余几个分组高,可以计算一下这几个分组间的显著性,然后比较

显著性计算和可视化

使用ggpubr包中的stat_compare_means函数在图形上显示不同组之间的显著性检验结果。

调用常见的统计检验方法(例如t检验、Wilcoxon秩和检验、ANOVA等)来比较不同组之间的数值差异,并返回显著性标记。

根据comparisons参数中定义的组别对来计算两两显著性。例如,如果comparisons = list(c("Group1", "Group2")),则只比较“Group1”和“Group2”之间的显著性。 若未指定具体组对,并且数据包含多个组,会默认进行全局比较。

根据选择的检验方法,stat_compare_means会在数据内部执行相关的显著性检验,返回每组对的p值。

根据计算得到的p值,生成对应的显著性标记(如*、**、***、****),并根据p值范围控制标记显示:

ns:表示“不显著”(not significant),即 p 值 > 0.05,表明两组之间的差异没有统计学显著性。*:表示 p 值 ≤ 0.05,表明两组之间的差异具有统计学显著性。**:表示 p 值 ≤ 0.01,差异高度显著。***:表示 p 值 ≤ 0.001,差异极显著。****:表示 p 值 ≤ 0.0001,差异非常显著。

可以通过参数label = "p.signif"(仅显示显著性标记)或label = "p"(显示具体的p值)进行控制。

1. 选择需要比较的分组进行显著性计算和展示
#根据需要选择进行比较的分组my_comparisons <- list( c("CD8 T", "FCGR3A+ Mono"), c("FCGR3A+ Mono", "NK"), c("NK", "DC"))library(ggpubr)# 将VlnPlot转换为ggplot对象,然后添加显著性比较p + stat_compare_means(comparisons = my_comparisons,method = "t.test")+  ylim(-2, 15)

图片

2. 用*号显示显著性标记,不显示具体数值
#用*号显示显著性标记,不显示具体数值p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+  ylim(-2, 15)

图片

3. stat_summary()将每个组的均值显示为红点
#stat_summary()将每个组的均值显示为红点,便于对比哪个组的平均表达水平更高。p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+  ylim(-2, 15)+  stat_summary(fun = mean, geom = "point", color = "red", size = 3)

图片

stat_summary 是ggplot2包中的一个函数,可用于在图中添加统计摘要(例如均值、标准差、中位数等),可以将将指定的统计计算结果(如平均值或中位数)直接叠加到现有的图层上

如果在计算出不同分组的显著性之后,不能直接看出来哪个组比哪个组高,可以tat_summary()将每个组的均值显示为红点,便于对比

文末友情宣传

如果你也想做单细胞转录组数据分析,最好是有自己的计算机资源哦,比如我们的2024的共享服务器交个朋友福利价仍然是800,而且还需要有基本的生物信息学基础,也可以看看我们的生物信息学马拉松授课,你的生物信息学入门课。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

相关资讯Related Articles

  • 使用小提琴图可视化目的基因并计算显著性

    2025-07-06

    前情回顾 在这个月的前几期推文中,主要基于单细胞数据使用小提琴图可视化marker基因进行了整理: VlnPlot结果及常用参数浅析 基于VlnPlot参数及ggplot2美化小提琴图 也有一期答读者问——小提琴图有点无图是何缘由? 这期就一起来学习一下画目的基因的小提琴图并计算显著性! 小提琴图可视化并计算显著性用途 在单细胞数据分析中,通过小提琴图可视化和显著性计算可以帮助研究者直观且统计地评...

  • 展会流量变经贸增量——第四届中国—非洲经贸博览会合作成果丰硕

    2025-06-26

    中非友谊跨越山海,经贸合作潮涌潇湘。6月12日至15日,以“中非共行动逐梦现代化”为主题的第四届中国—非洲经贸博览会在湖南长沙举行。 作为中非合作论坛经贸举措落实的重要平台,本届博览会围绕落实中非携手推进现代化“十大伙伴行动”,组织各类经贸活动30余场,合作成果务实丰硕。 尼日利亚中国农业科技园项目、拉各斯阿布贾(快速)列车项目……据介绍,本届博览会签约项目176个、金额113.9亿美元,较上一届...

  • 北理工46岁院长出轨学生:多张照片流出,情人发声,处理结果公布

    2025-05-25

    众所周知,师生恋虽然在法律上并没有被明确禁止,但教育部和各个学校通常是不允许,这旨在维护校园风气、保护学生利益和取保教育公平、公正。因此,老师出轨学生的事情不仅不被社会所允许,而且还会受到道德的谴责和法律的制裁,最终必将是既赔工作又要受到道德的谴责。 4月20日上午,教育界传来令人闻所未闻的丑闻,网传北京理工大学一名副院长、男教授出轨自己24岁的男学生,学校在十二个小时内连放两个通告,公布处理结果...

  • 美信科技(301577.SZ)未来业绩增长点主要聚焦于信号类与功

    2025-05-23

    (原标题:美信科技(301577.SZ)未来业绩增长点主要聚焦于信号类与功率类磁性元器件业务的双向突破) 格隆汇5月16日丨美信科技(301577.SZ)在互动平台表示,公司未来业绩增长点主要聚焦于信号类与功率类磁性元器件业务的双向突破。随着自动化产线迭代升级、核心工艺持续精进,以及湾区产能稳步扩容,公司功率类磁性元器件业务依托规模化形成的成本优势与显著提升的品质稳定性,正加速崛起为战略升级的重要...