ai:eos:endeavour上优化ollama

设置环境变量，通过环境变量配置模型路径或其他参数。
1. 方法一：使用命令行
  1. 1. 打开命令提示符或 PowerShell。
  2. 2. 使用 `setx` 命令设置环境变量：
```
   setx OLLAMA_MODEL_PATH "C:\path\to\your\model"
```
2. 方法二：通过系统设置
  1. 右键点击“此电脑”或“我的电脑”，选择“属性”。
  2. 点击“高级系统设置”。
  3. 在“系统属性”窗口中，点击“环境变量”。
  4. 在“系统变量”或“用户变量”部分，点击“新建”。
  5. 输入变量名（如 `OLLAMA_MODEL_PATH`）和变量值（如 `C:\path\to\your\model`），然后点击“确定”。
启动 Ollama 时指定模型,如果 Ollama 支持命令行参数，可以直接在启动时指定模型路径：
```
ollama --model-path "C:\path\to\your\model"
```
验证设置,确保环境变量设置正确，可以通过以下命令验证：
```
echo %OLLAMA_MODEL_PATH%
```

`Ollama` 可能支持一些参数来优化多线程性能。你可以尝试以下方法：

如果 `Ollama` 支持环境变量或命令行参数来设置线程数，可以通过以下方式调整：

  <code bash>
  OLLAMA_NUM_THREADS=4 ollama run <模型名>
  </code>
  将 `4` 替换为你希望使用的线程数。

如果 `Ollama` 支持 GPU 加速，确保已安装 GPU 驱动和相关依赖（如 CUDA），然后尝试启用 GPU：

  <code bash>
  OLLAMA_USE_GPU=1 ollama run <模型名>
  </code>

    import torch
    torch.set_num_threads(4)  # 设置 PyTorch 使用的线程数

如果你发现 `Ollama` 本身对多线程支持有限，可以尝试通过外部工具（如 `taskset` 或 `numactl`）将进程绑定到特定 CPU 核心，以优化性能：

    taskset -c 0-3 ollama run <模型名>

  这将限制 `Ollama` 使用前 4 个 CPU 核心。

    ollama update

如果以上方法仍无法满足需求，可以查阅 `Ollama` 的官方文档或社区支持，获取更多关于多线程运行的指导。