根据猿代码和boss直聘上的一些内容整理出来的东西,权当玩闹吧。

运维基础

Linux系统运维

  1. Linux的部署和维护操作;
  2. Shell脚本的编写;
  3. 硬件服务器的管理和维护

集群用户管理

  1. 用户的管理和维护
  2. LDAP的使用和维护

Python编程基础

  1. 基础语法
  2. 数据结构
  3. 函数和类
  4. 文件操作
  5. 异常处理

高性能计算

高速网络运维管理

  1. TCP/IP协议栈
  2. 扩展介绍
  3. IB网络维护
  4. RDMA网络维护

共享存储

  1. NFS共享文件系统搭建
  2. Lustre共享文件系统搭建
  3. Lustre文件系统使用以及日常维护

软件部署

  1. 基于Make管理工具的安装
  2. 基于Cmake管理工具的安装

软件环境维护

  1. module环境管理
  2. conda环境管理
  3. spack环境管理
  4. docker容器使用
  5. singularity容器使用

AI维护

深度学习理论基础

  1. 神经网络基础
  2. 反向传播算法
  3. 梯度下降和其他优化算法
  4. 损失函数和激活函数

TensofFlow和PyTorch基础

  1. TensorFlow基础操作
  2. PyTorch基础操作
  3. TensorFlow和PyTorch的模型定义和训练
  4. TensorFlow和PyTorch的模型保存和加载

数据处理技术

  1. 数据清洗技术
  2. 数据标注技术
  3. 数据增强技术

模型训练与优化

  1. 模型选择技术
  2. 超参数调整技术
  3. 模型验证技术

模型维护与部署

  1. 模型转换技术
  2. 模型上线技术
  3. 模型监控技术

业务理解

  1. 业务需求理解
  2. 业务数据理解
  3. 业务结果解读