1、超算资源使用的网络安全规范

为贯彻落实《中华人民共和国网络安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国数据安全法》、《关键信息基础设施安全保护条例》以及网络安全等级保护要求等相关法律法规和文件规定的要求,进一步加强和优化超算科技园和软件园的网络安全防护工作,山东省计算中心(国家超级计算济南中心)(以下简称“中心”) 按照 “谁使用谁负责”的原则,制定网络安全责任承诺书,提高网络安全责任意识,推进安全问题整改进度,强化业务应用运行环境安全。
hpc资源使用的网络安全责任承诺主体为:资源申请人和资源试用/使用团队。
1)、用户在平台上进行的数据处理和存储应符合相关法律法规和保密要求,不得传播、存储非法或侵权信息。
2)、集群登录需要先进行vpn登录,用户不得有偿或无偿转让所申请的账号及账号的使用权,也不得借用他人账号使用计算资源。否则该账户引起的所有问题(如网络安全问题和计算费用问题等),由账户申请者负责。
3)、对于违反规定进行挖矿行为的用户,超算中心将依据相关法律法规和规定进行严肃处理。包括但不限于警告、暂停使用超算资源、终止合作关系等措施,并保留追究法律责任的权利。
4)、用户应保证用于远程登录超算集群的终端的安全性,如终端系统内无病毒和木马等,不得使用存在安全隐患的网络及终端登录超算集群,不随意点击可疑链接和下载未知来源的附件。

2.关于不得在登录节点运行算例程序!!!

用户登录到集群后,使用的节点为login登录节点,登录节点只能用来进行编辑编译工作,请不要在登录节点直接执行计算程序。请使用作业提交脚本将程序调度到计算节点上运行算例程序,参考【2.3】部分。
如在登陆节点直接运行程序,管理员有权杀掉程序进程,次数过多则封禁账号限制登录,敬请遵守规定!有编译需求的用户,编译进程请控制在2个以内,避免登录节点负载过高影响大家的使用体验,谢谢配合!

3.关于vpn密码锁定问题

vpn使用时密码多次输入错误导致账号锁定,请耐心等待15分钟,15分钟后自动解锁

4.关于使用mobaxterm工具登录

使用mobaxterm工具登录集群时,输入密码时不显示字符为正常现象,正常进行密码输入即可

5.关于linux数据删除

由于linux数据删除为不可逆操作,无法进行数据恢复,进行删除操作前请谨慎操作

6.关于集群联网问题

为保证客户数据安全,集群不与互联网互通,git与wget等网络下载命令无法使用,软件安装包均需从本地电脑有网环境下载后上传到集群

7.关于yum使用问题

集群用户无root权限如需yum安装指定库等请联系技术支持人员进行流程申请后技术支持人员协助安装或自己进行源码包安装

8.关于计算资源浪费

若作业非满核心运行,请提前联系技术支持人员进行脚本相应更改,避免大量提交作业造成资源节点浪费
非满核心计算且对内存需求不高的情况下,在作业提交脚本中加上#SBATCH –mem-per-cpu= 的参数,提高节点资源利用率,避免资源浪费
例子:#SBATCH –mem-per-cpu=10g 标明此作业只占用节点10g内存资源,同一节点还可以根据剩余的核心数与内存量进行作业提交

9.图形化界面

在集群环境中,所有操作均以命令行形式进行,集群无图形化界面

10.软件

使用商业软件时,例如vasp,matlab,ansys等版权软件需提供相应的安装包及许可,联系技术支持人员进行协助安装

11.关于使用win版算例

使用win版算例请检查算例内容是否存在中文字符或C:/用户/等win版绝对路径,防止算例运行失败
例如:DOS UNIX格式问题导致的提交失败
sbatch: error: Batch script contains Dos line breaks
sbatch: error: instead ofexpected UNIX line breaks
此问题处理请参考【2.4】

12.winscp等传输工具数据传输较慢

ssl vpn+ssh传输过程有两层加密,这个和运营商的优先级有关系,vpn只能保障登录进来正常操作,没办法保证文件传输的速度
移动:https://112.6.51.12:443
电信:https://58.59.15.67:443
联通:https://124.128.14.54:443
vpn登录时可以用对应运营商的地址登录,分别是移动,电信,联通,或更换网络环境

13.数据传输

需要上传下载的计算数据量过大时,建议使用邮寄硬盘的形式进行数据传输,这样可以避免网络传输速度慢或网络波动导致数据传输中断
移动硬盘数据传输速度与USB2.0,3.0,硬盘的类型,数据小文件数量的多少都有关系
若数据为单个大文件传输服务器传输速度约为100到150MB/s,若为多个小文件传输服务器传输速度约为10到20MB/s

14.取消作业

取消作业请使用 以下命令进行取消,直接删除文件夹,作业会继续运行,会继续使用机时
squeue
         JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
          9446   intel01     bash    shizs  R 4-19:20:08      1 n03521
scancel 9446
作者:admin  创建时间:2023-11-20 15:30
最后编辑:admin  更新时间:2024-09-05 11:18