0%

在做好了前期的一些预处理后,我们便可以对数据进行聚类分析去得到一些我们想要的初步分析结果了,对细胞进行聚类主要有两种方法:聚类算法(clustering algorithms)和社区检测算法(community detection methods)。目前单细胞聚类的主流方法是在单细胞数据的knn图上通过社区检测算法(包括louvain和leiden)进行聚类分析。

阅读全文 »

在这一步我们对加载入Seurat的数据进行进一步的质量控制,剔掉一些质量较差的细胞。其实在读入数据时,我们已经剔除了一部分的基因,例如我们筛掉了表达基因少于200个的细胞和在少于三个细胞中表达的基因。而在这一步,我们会从其它的一些指标来对我们的数据进行质控。

接下来我们对数据进行Normalization,这样做好处多多,可以使数据之间具有可比性,并且可以使数据的分布近似于下游分析的假设(正态分布)。但值得注意的是,理论上没有一种Normalization的方法适用于所有数据,我们应该根据数据集的情况选择合适的Normalization方法。

阅读全文 »