一、集群简介
一个计算集群是由一组计算性能强劲的计算机通过高速网络连接后组成。集群中某单台计算机被称为节点(node)。高性能计算集群一般由登录节点、计算节点和存储节点组成。

用户需要先连接到登录节点,登录节点是连接整个集群的入口。用户通过登录节点来进一步调用计算资源。
计算节点,是提供计算服务的计算机节点,可以是CPU节点或GPU节点。通常情况下,一个用户作业任务需要一台或多台计算节点来支持其计算服务。
将某个计算作业任务分配到不同计算节点上进行计算的工具被称为作业调度系统,常见的有Slurm,PBS等。
计算作业一般需要读写文件,我们采用了共享存储系统,将存储节点的磁盘空间映射到所有计算节点上。共享存储的可用磁盘容量非常大,用户可以像操作本地的文件一样操作远程的存储节点上的文件。
注意:请勿在集群的登陆节点执行多核并行的计算任务!
二、登陆集群
1. 安装xshell
点击下方链接下载家庭和学校免费版的xshell
打开下载好的安装包并进行安装,安装好后填入姓名和邮箱进行注册激活
2. SSH登录
打开xshell 8后,在弹出的对话框中点击“新建”

在弹出的界面中按照①②③④顺序依次操作,填写连接信息

在弹出的界面中按照①②③顺序依次操作,填写用户身份验证信息




3. 线路选择
登录集群有移动、联通和电信三条线路可供选择,点击下方链接确定自己的线路运营商,选择合适的线路

三、文件传输
1. 安装WinSCP
点击下方链接下载WinSCP
打开下载好的安装包并进行安装
2. 连接服务器
打开winscp后,按照下方提示,填写服务器信息





3. 断点续传
WinSCP支持断点续传功能,允许在传输过程中因网络中断或其他意外情况导致传输失败时,能够从中断的位置继续传输,而无需重新开始整个文件传输过程

设置好断点续传功能后,下载文件时,个人电脑上对应文件夹内会出现.filepart格式的文件,若传输失败,只要不删除.filepart格式文件,再次向此文件夹下载相同文件,即可实现自动续传
四、作业管理
1. Slurm作业管理系统
超算集群不能在登陆节点计算任务,需要提交到计算节点,怎么提交呢?用作业管理系统提交。Slurm就是其中一种。
