环境配置
概要
AladdinEdu内置了部分公共镜像,启动workshop时选择公共镜像就会自带相应框架的软件。如果自带的框架版本或Python版本不满足需求,请自行配置其他版本的框架或尝试Python方法。如默认镜像不满足您的需求,需自定义安装包,请务必先了解以下流程图:

a. 在workshop安装的python包、apt等应用,需要保存镜像后才能被GPU session使用;.
- 公共镜像
| 镜像类型 | 版本标签 | 包含内容 |
|---|---|---|
| torch | 2.5.1-cu124 | 核心包:torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 cuda==12.4附加包: datasets transformers scikit-learn peft tiktoken blobfile sentencepiece protobuf deepspeed |
| torch | 2.6.0-cu124 | 核心包:torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 cuda==12.4附加包: 同 2.5.1 版本 |
| jupyter-lab | 4.4.2 | 核心包:jupyterlab==4.4.2 torch==2.5.1+cu124 cuda==12.4 |
| llama-factory | v0.9.3.dev0-cuda12.4-cudnn9-devel | 核心包: llamafactory==0.9.3 peft==0.15.1 trl==0.9.6accelerate==1.6.0 transformers==4.51.3torch==2.7.0 cuda==12.6 |
| llama-factory | v0.9.3.dev0-cuda12.1-cudnn9-devel | 核心包: llamafactory==0.9.3 peft==0.15.1 trl==0.9.6accelerate==1.6.0 transformers==4.51.3torch==2.7.0 cuda==12.1 |
| python | 3.10/3.11/3.12/3.13 | 纯净Python环境 |
| ubuntu | 22.04 | 纯净 Ubuntu 22.04 系统 |
| pytorch | 2.3.1-cuda12.1-py3.11 | 核心包:torch==2.3.1+cu121 torchaudio==2.3.1+cu121 torchvision==0.18.1+cu121 cuda==12.1附加包: numpy scipy pandas matplotlib scikit-learn jupyterlab opencv-python-headless pillow tqdm requests |
| pytorch | 2.3.1-cuda11.8-py3.11 | 核心包:torch==2.3.1+cu118 torchaudio==2.3.1+cu118 torchvision==0.18.1+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.3.1-cuda12.1-py3.10 | 核心包:torch==2.3.1+cu121 torchaudio==2.3.1+cu121 torchvision==0.18.1+cu121 cuda==12.1附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.3.1-cuda11.8-py3.10 | 核心包:torch==2.3.1+cu118 torchaudio==2.3.1+cu118 torchvision==0.18.1+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.2.2-cuda12.1-py3.11 | 核心包:torch==2.2.2+cu121 torchaudio==2.2.2+cu121 torchvision==0.17.2+cu121 cuda==12.1附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.2.2-cuda11.8-py3.11 | 核心包:torch==2.2.2+cu118 torchaudio==2.2.2+cu118 torchvision==0.17.2+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.2.2-cuda12.1-py3.10 | 核心包:torch==2.2.2+cu121 torchaudio==2.2.2+cu121 torchvision==0.17.2+cu121 cuda==12.1附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.2.2-cuda11.8-py3.10 | 核心包:torch==2.2.2+cu118 torchaudio==2.2.2+cu118 torchvision==0.17.2+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.1.2-cuda12.1-py3.11 | 核心包:torch==2.1.2+cu121 torchaudio==2.1.2+cu121 torchvision==0.16.2+cu121 cuda==12.1附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.1.2-cuda11.8-py3.11 | 核心包:torch==2.1.2+cu118 torchaudio==2.1.2+cu118 torchvision==0.16.2+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.1.2-cuda12.1-py3.10 | 核心包:torch==2.1.2+cu121 torchaudio==2.1.2+cu121 torchvision==0.16.2+cu121 cuda==12.1附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| pytorch | 2.1.2-cuda11.8-py3.10 | 核心包:torch==2.1.2+cu118 torchaudio==2.1.2+cu118 torchvision==0.16.2+cu118 cuda==11.8附加包: 同 2.3.1-cuda12.1-py3.11 版本 |
| tensorflow | 2.16.1-cuda12.3-py3.11 | 核心包:tensorflow==2.16.1 keras==3.11.3 cuda==12.3附加包: numpy scipy pandas matplotlib scikit-learn jupyterlab opencv-python-headless pillow tqdm requests h5py protobuf |
| tensorflow | 2.16.1-cuda12.3-py3.10 | 核心包:tensorflow==2.16.1 keras==3.11.3 cuda==12.3附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.15.0-cuda12.2-py3.11 | 核心包:tensorflow==2.15.0 keras==2.15.0 cuda==12.2附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.15.0-cuda12.2-py3.10 | 核心包:tensorflow==2.15.0 keras==2.15.0 cuda==12.2附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.14.0-cuda11.8-py3.11 | 核心包:tensorflow==2.14.0 keras==2.14.0 cuda==11.8附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.14.0-cuda11.8-py3.10 | 核心包:tensorflow==2.14.0 keras==2.14.0 cuda==11.8附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.13.0-cuda11.8-py3.11 | 核心包:tensorflow==2.13.0 keras==2.13.1 cuda==11.8附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
| tensorflow | 2.13.0-cuda11.8-py3.10 | 核心包:tensorflow==2.13.0 keras==2.13.1 cuda==11.8附加包: 同 2.16.1-cuda12.3-py3.11 版本 |
注:jupyter-lab和llama-factory均已配conda。
- 如您选用jupyter-lab和llam-factory作为workshop的基础镜像,后续配置环境时无需再手动安装conda。
- 如需使用llama-factory微调,请参考llama-factory 微调
- 安装其他版本的Python: 推荐使用Miniconda创建其他版本的Python虚拟环境,可参考conda安装教程。
# 构建一个虚拟环境名为:myenv,Python版本为3.7
conda create -n myenv python=3.7
# 更新bashrc中的环境变量
conda init bash && source /root/.bashrc
# 切换到创建的虚拟环境:my-env
conda activate myenv
# 验证
python --version
- 安装PyTorch: 参考链接
❗ 注意: 1️⃣ 通过Torch官方的conda安装命令,在国内安装的conda一般为非cuda版本,而是cpu版本(有bug),因此推荐用pip安装。并且,如果使用torch官方的pip命令,去掉-f/--index-url参数,这样可以走国内的pip源,速度更快; 2️⃣ 平台中目前所提供显卡支持的最低cuda版本为11.8,过低版本可能会导致计算性能损失。
- 安装TensorFlow: 参考链接
- 推荐的使用姿势 (1)如果平台内置的公共镜像中有您需要的Torch、TensorFlow等框架的相应版本,首选公共镜像。 (2)如果以上条件都不满足,推荐使用Ubuntu系统,并自行安装miniconda进行环境配置。
私有镜像
AladdinEdu平台为每位用户提供了镜像仓库空间,支持保存您的私有镜像,分为两种方式:本地上传私有镜像、保存workshop环境镜像。私有镜像可在控制台的私有镜像仓库、本地VSCode的ENVIRONMENTS中查看。
私有镜像仓库的用户名、密码在控制台查看。若为空,请您联系平台客服修复。
上传私有镜像
- 打开您电脑的本地终端,逐条输入以下命令(以python3为例),使用docker推送,推送成功后即成功在私有镜像仓库中新增镜像:
# 登录
docker login registry.hd-01.alayanew.com:8443
# 拉取镜像
docker pull m.daocloud.io/docker.io/library/python:3
# 镜像tag重命名
docker tag m.daocloud.io/docker.io/library/python registry.hd-01.alayanew.com:8443/aladdinedu-e3fadb18-a994-470f-9a59-dde816718791/python:3
# 推送镜像
docker push registry.hd-01.alayanew.com:8443/aladdinedu-e3fadb18-a994-470f-9a59-dde816718791/python:3
- 在VSCode中登录Aladdin,并在Registry中填入私有镜像仓库的用户名、密码,登录私有镜像仓库:

- 此时,ENVIRONMENTS中可查看私有镜像仓库,其中列出了上传的私有镜像,在workshop、GPU配置页中可直接选择使用。

保存workshop环境
如需将在workshop中使用的环境保存到私有镜像中,可按如下步骤操作。需注意,以下步骤要求 workshop 为 running 状态。
- 在VSCode中登录Aladdin,并在Registry中填入私有镜像仓库的用户名、密码,登录私有镜像仓库:

- 启动workshop, 右键选择“Save Env”:

- 选择私有镜像仓库,回车:

- 输入要保存的workshop环境名,回车:

- 输入tag,回车,等待保存:

- 选择yes,更新当前workshop镜像:
如果选择no,保存的workshop环境不会作用于当前workshop。
- 更新成功后,私有镜像仓库中即会存有该环境,此时在workshop、GPU配置页中可选择使用该环境。
