API Key将保存在浏览器本地存储中。格式: rpa_开头的长字符串
点击上面的按钮开始测试...
Workers启动正常但处理请求时超时,通常是模型加载问题
登录RunPod控制台 → 选择你的Endpoint → 查看实时日志
确认 L3.2-8X3B.gguf 和 L3.2-8X4B.gguf 存在于 /runpod-volume/text_models/
18B/21B参数的模型需要大量内存,确保RunPod分配了足够的GPU内存
考虑使用更小的模型或增加超时时间
在RunPod控制台重新部署endpoint,确保所有依赖正确安装