环境配置

概要

AladdinEdu内置了部分公共镜像，启动workshop时选择公共镜像就会自带相应框架的软件。如果自带的框架版本或Python版本不满足需求，请自行配置其他版本的框架或尝试Python方法。如默认镜像不满足您的需求，需自定义安装包，请务必先了解以下流程图：

在workshop安装的python包、apt等应用，需要保存镜像后才能被GPU session使用。

基础镜像

镜像类型	版本标签	包含内容
torch	2.5.1-cu124	核心包: `torch==2.5.1` `torchvision==0.20.1` `torchaudio==2.5.1` `cuda==12.4` 附加包: `datasets` `transformers` `scikit-learn` `peft` `tiktoken` `blobfile` `sentencepiece` `protobuf` `deepspeed`
torch	2.6.0-cu124	核心包: `torch==2.6.0` `torchvision==0.21.0` `torchaudio==2.6.0` `cuda==12.4` 附加包: 同 2.5.1 版本
python	3.10/3.11/3.12/3.13	纯净Python环境
ubuntu	22.04	纯净 Ubuntu 22.04 系统
pytorch	2.3.1-cuda12.1-py3.11	核心包: `torch==2.3.1+cu121` `torchaudio==2.3.1+cu121` `torchvision==0.18.1+cu121` `cuda==12.1` 附加包: `numpy` `scipy` `pandas` `matplotlib` `scikit-learn` `jupyterlab` `opencv-python-headless` `pillow` `tqdm` `requests`
pytorch	2.3.1-cuda11.8-py3.11	核心包: `torch==2.3.1+cu118` `torchaudio==2.3.1+cu118` `torchvision==0.18.1+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.3.1-cuda12.1-py3.10	核心包: `torch==2.3.1+cu121` `torchaudio==2.3.1+cu121` `torchvision==0.18.1+cu121` `cuda==12.1` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.3.1-cuda11.8-py3.10	核心包: `torch==2.3.1+cu118` `torchaudio==2.3.1+cu118` `torchvision==0.18.1+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.2.2-cuda12.1-py3.11	核心包: `torch==2.2.2+cu121` `torchaudio==2.2.2+cu121` `torchvision==0.17.2+cu121` `cuda==12.1` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.2.2-cuda11.8-py3.11	核心包: `torch==2.2.2+cu118` `torchaudio==2.2.2+cu118` `torchvision==0.17.2+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.2.2-cuda12.1-py3.10	核心包: `torch==2.2.2+cu121` `torchaudio==2.2.2+cu121` `torchvision==0.17.2+cu121` `cuda==12.1` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.2.2-cuda11.8-py3.10	核心包: `torch==2.2.2+cu118` `torchaudio==2.2.2+cu118` `torchvision==0.17.2+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.1.2-cuda12.1-py3.11	核心包: `torch==2.1.2+cu121` `torchaudio==2.1.2+cu121` `torchvision==0.16.2+cu121` `cuda==12.1` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.1.2-cuda11.8-py3.11	核心包: `torch==2.1.2+cu118` `torchaudio==2.1.2+cu118` `torchvision==0.16.2+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.1.2-cuda12.1-py3.10	核心包: `torch==2.1.2+cu121` `torchaudio==2.1.2+cu121` `torchvision==0.16.2+cu121` `cuda==12.1` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
pytorch	2.1.2-cuda11.8-py3.10	核心包: `torch==2.1.2+cu118` `torchaudio==2.1.2+cu118` `torchvision==0.16.2+cu118` `cuda==11.8` 附加包: 同 2.3.1-cuda12.1-py3.11 版本
tensorflow	2.16.1-cuda12.3-py3.11	核心包: `tensorflow==2.16.1` `keras==3.11.3` `cuda==12.3` 附加包: `numpy` `scipy` `pandas` `matplotlib` `scikit-learn` `jupyterlab` `opencv-python-headless` `pillow` `tqdm` `requests` `h5py` `protobuf`
tensorflow	2.16.1-cuda12.3-py3.10	核心包: `tensorflow==2.16.1` `keras==3.11.3` `cuda==12.3` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.15.0-cuda12.2-py3.11	核心包: `tensorflow==2.15.0` `keras==2.15.0` `cuda==12.2` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.15.0-cuda12.2-py3.10	核心包: `tensorflow==2.15.0` `keras==2.15.0` `cuda==12.2` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.14.0-cuda11.8-py3.11	核心包: `tensorflow==2.14.0` `keras==2.14.0` `cuda==11.8` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.14.0-cuda11.8-py3.10	核心包: `tensorflow==2.14.0` `keras==2.14.0` `cuda==11.8` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.13.0-cuda11.8-py3.11	核心包: `tensorflow==2.13.0` `keras==2.13.1` `cuda==11.8` 附加包: 同 2.16.1-cuda12.3-py3.11 版本
tensorflow	2.13.0-cuda11.8-py3.10	核心包: `tensorflow==2.13.0` `keras==2.13.1` `cuda==11.8` 附加包: 同 2.16.1-cuda12.3-py3.11 版本

社区镜像

平台中还配置了很多社区镜像，您可以在创建工作台时调用：

commuimage1

社区镜像加载时需要更长的时间（约1-3分钟），请您耐心等待：

commuimage2

打开远端页面后，如您已正确安装远端插件，则会默认打开一个md文件，推荐安装“Markdown Preview Enhanced”插件进行预览：

commuimage3

按照README步骤即可跑通指定项目：

commuimage3

若README文件意外关闭，或远端插件未安装成功，可使用以下命令将README文件复制到工作目录下：
cp -r /opt/aladdin/README.md /root

安装其他版本的Python：推荐使用Miniconda创建其他版本的Python虚拟环境，可参考conda安装教程。

# 构建一个虚拟环境名为：myenv，Python版本为3.7
conda create -n myenv python=3.7    

# 更新bashrc中的环境变量
conda init bash && source /root/.bashrc
# 切换到创建的虚拟环境：my-env
conda activate myenv

# 验证
python --version

安装PyTorch：参考链接

❗ 注意： 1️⃣ 通过Torch官方的conda安装命令，在国内安装的conda一般为非cuda版本，而是cpu版本（有bug），因此推荐用pip安装。并且，如果使用torch官方的pip命令，去掉-f/--index-url参数，这样可以走国内的pip源，速度更快； 2️⃣ 平台中目前所提供显卡支持的最低cuda版本为11.8，过低版本可能会导致计算性能损失。

安装TensorFlow：参考链接

推荐的使用姿势 （1）如果平台内置的公共镜像中有您需要的Torch、TensorFlow等框架的相应版本，首选公共镜像。（2）如果以上条件都不满足，推荐使用Ubuntu系统，并自行安装miniconda进行环境配置。

个人镜像

AladdinEdu平台为每位用户提供了镜像仓库空间，支持保存您的个人镜像，分为两种方式：通过docker等工具从本地上传个人镜像、保存workshop环境的镜像。个人镜像可在控制台的个人镜像仓库、本地VSCode的镜像-个人镜像中查看。

上传个人镜像

打开您电脑的本地终端，逐条输入以下命令（以python3为例），使用docker推送，推送成功后即成功在个人镜像仓库中新增镜像：

您的个人镜像中必须包含openssh组件，否则无法正常使用！

# 登录
docker login registry.hd-01.alayanew.com:8443
# 拉取镜像
docker pull m.daocloud.io/docker.io/library/python:3
# 镜像tag重命名
docker tag m.daocloud.io/docker.io/library/python registry.hd-01.alayanew.com:8443/aladdinedu-e3fadb18-a994-470f-9a59-dde816718791/python:3
# 推送镜像
docker push registry.hd-01.alayanew.com:8443/aladdinedu-e3fadb18-a994-470f-9a59-dde816718791/python:3