聚类分析软件是主要用于项目聚类分析的工具。软件功能强大,可以对文章的杂合度和信息量进行计算分析,支持分析结果以图形和文字的形式显示,方便用户更详细地查看和表达分析结果。
软件介绍
软件主要用于血型、蛋白质多态性、品种聚类等统计分析。它能自动计算杂合度、多态性信息量、遗传距离和聚类,并能自动绘制聚类图。
聚类分析简介
聚类分析是指将物理或抽象对象的集合分组到由相似对象组成的多个类中的分析过程。这是一种重要的人类行为。
聚类分析的目标是收集数据,在相似性的基础上进行分类。聚类来自许多领域,包括数学、计算机科学、统计学、生物学和经济学。在不同的应用领域,出现了许多聚类技术,用来描述数据,度量不同数据源之间的相似性,将数据源划分到不同的簇中。
功能介绍
1、定义矩阵
定义数据矩阵的大小,用“长宽”表示,X轴方向为变量,Y轴为数据;用罗杰公式计算遗传距离时只需根据需要输入分类号(位数),系统默认值为“1”。如果输入“5”“4”和“2”,则表示有5个品种,4行数据,2个基因位点。该系统支持多达255个品种和9999条数据。
2、输入数据
根据定义的矩阵创建空白矩阵。如果没有定义矩阵大小,则根据当前矩阵的大小创建一个空白矩阵。
3、读入数据
通过“保存矩阵”命令将保存到磁盘的数据读入系统,系统会自动创建一个大小合适的矩阵并读取所有数据。
4、追加数据
在当前矩阵的末尾继续添加一个保存的数据,主要用于计算遗传距离。
5、读入遗传距离
读取保存到磁盘的遗传距离数据,可以直接用于聚类计算。
6、数据正规化
根据标准偏差标准化方法处理当前矩阵中的数据。注意:单击此命令后,处理后的数据将用于计算遗传距离和聚类。只有重新读取或查看原始数据后,才会恢复原始数据,然后根据原始数据计算遗传距离和聚类计算。
7、计算杂合度
根据Nei公式(1974)计算每个品种的杂合度。
8、计算多态性
根据Nei(1974)公式计算各品种的多态信息含量。
9、计算欧氏距离
将数据读入系统后,可以使用该命令根据罗杰公式计算品种间的遗传距离。注意:如果类别数(等位基因数)没有在定义矩阵中定义,系统默认为1。在这种情况下,计算的遗传距离与Mahalanobis公式计算的遗传距离相同。未注册用户最后三个品种的遗传距离不显示。
10、计算遗传距离
将数据读入系统后,该命令可用于根据Nei's公式(1983)计算品种间的遗传距离。未注册用户最后三个品种的遗传距离不显示。
11、进行聚类计算
在计算或读入遗传距离后,可以使用该命令根据P.H.A.Sneath等人(1973)的类平均聚类法(UPGMA法,也称为未加权算术平均配对聚类法)进行系统聚类。聚类结果显示,第一列的数字是序号,代表聚类时间。第二列d是距离系数;第3列和第4列breed1和breed2是参与聚类的两个品种,第5列Cluster是聚类后的新名称,第6列Content是两个品种的名称。未注册用户的最后3个聚类结果不会显示。
12、查看原始数据
将原始数据读入当前矩阵。并且标准化的数据被清除。
13、查看遗传距离
读取的遗传距离或计算的遗传距离显示在当前矩阵中。
14、查看聚类图
根据聚类的结果,自动绘制聚类图。
15、保存聚类图
将显示的聚类图作为图像文件保存到磁盘。未注册用户没有此功能!
16、保存矩阵
将当前矩阵保存到磁盘。如果当前矩阵是原始数据,则保存原始数据;如果是归一化数据,保存处理后的数据;如果是杂合性,杂合性保存;如果是聚类结果,则保存聚类结果。未注册用户没有此功能!
17、数据导出
系统自动判断当前所有矩阵中包含的数据,并导出为Excel文件。未注册用户没有此功能!
:
使用方法
1.安装完成后,点击桌面上的软件打开,界面如图。
2.点击定义矩阵,可以控制数据矩阵,定义数据矩阵的大小,用“长宽”表示,X轴方向为变化量,Y轴为数据量;用罗杰公式计算遗传距离时只需根据需要输入分类号(位数),系统默认值为“1”。如果输入“5”“4”和“2”,则表示有5个品种,4行数据,2个基因位点。该系统支持多达255个品种和9999条数据。
3.输入数据,将您的分析数据文件导入软件进行分析,并根据定义的矩阵创建空白矩阵。如果未定义矩阵大小,则根据当前矩阵大小创建一个空白矩阵。
4.数据归一化,可以自动对数据进行排版,并按照标准差标准化方法对当前矩阵中的数据进行处理。注意:单击此命令后,处理后的数据将用于计算遗传距离和聚类。只有重新读取或查看原始数据后,才会恢复原始数据,然后根据原始数据计算遗传距离和聚类计算。
5.计算命令。可以点击不同的计算项进行数据分析,有计算杂合度、计算多态性、计算欧氏距离、聚类计算等功能。
6.数据查看和保存命令,查看原始数据,查看遗传距离,保存聚类图,保存矩阵和数据导出。
运行环境
1、硬件环境
硬件名称最低配置推荐配置
CPU CPU 586奔腾P II或以上或兼容芯片。
超过32M 64M的内存
硬盘可用空间在1m和10m以上。
显示VGA真彩色超级VGA或液晶显示器
2、软件环境
操作系统:Windows95/98/Me/Nt/2000/Xp。
并且安装了Excel97及以上的办公软件,否则无法将数据导出到Excel文件。
3、推荐使用
Win2000或Xp操作系统。该软件已通过win98和win2000的测试。如果不能正常运行,请联系作者。
上面给大家详细的介绍了聚类分析,以上内容仅2u手游网小编个人理解,最后希望大家喜欢!