入门指南

快速开始

Infernet 提供与 OpenAI 完全兼容的 API 接口。如果你已经在使用 OpenAI API，只需修改 base_url 即可无缝迁移。

第一步：获取 API Key

前往注册页面创建账号，或登录现有账号。在控制台的"API Keys"页面点击"创建新 Key"。

🎁 新注册用户自动获得 10 万 tokens 免费额度，无需绑定信用卡即可开始测试。

认证方式

所有 API 请求均需在 HTTP Header 中携带 API Key：

HTTP Header Authorization: Bearer infernet-sk-your_key_here

第二步：发起第一次请求

Infernet API 的 endpoint 为 https://api.infernet.ai/v1，与 OpenAI 格式完全一致：

Python from openai import OpenAI client = OpenAI( base_url="https://api.infernet.ai/v1", api_key="infernet-sk-xxxx" ) response = client.chat.completions.create( model="llama-3-8b-instruct", messages=[ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "What is quantum entanglement?"} ] ) print(response.choices[0].message.content)

Streaming 流式输出

设置 stream=True 开启流式返回，适用于实时对话场景：

Python stream = client.chat.completions.create( model="qwen2.5-72b-instruct", messages=[{"role": "user", "content": "写一首关于AI的诗"}], stream=True ) for chunk in stream: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="", flush=True)

查询可用模型

cURL curl https://api.infernet.ai/v1/models \ -H "Authorization: Bearer infernet-sk-xxxx"

响应示例：

JSON { "object": "list", "data": [ { "id": "llama-3-8b-instruct", "object": "model", "context_window": 8192, "pricing": { "input": "$0.10/1M", "output": "$0.15/1M" } }, ... ] }

限流说明

每个套餐有对应的请求频率限制。当超过限制时，API 返回 429 Too Many Requests，响应头中包含：

HTTP Headers X-RateLimit-Limit: 300 # 每分钟最大请求数 X-RateLimit-Remaining: 245 # 本分钟剩余请求数 X-RateLimit-Reset: 1736650860 # 配额重置时间戳（Unix） Retry-After: 45 # 建议等待秒数

错误码参考

HTTP 状态码	错误类型	说明
`401`	invalid_api_key	API Key 无效或已过期
`402`	insufficient_balance	账户余额不足，请充值
`404`	model_not_found	指定的模型不存在
`429`	rate_limit_exceeded	超过请求频率限制，参考 Retry-After
`503`	no_available_node	当前无可用节点，请稍后重试
`500`	server_error	平台内部错误，已自动告警

供给方接入

成为 Provider 节点

将你的 GPU 设备接入 Infernet 算力网络，在设备闲置时自动承接推理任务并赚取收益。

注册供给方账号

前往供给方注册页面，选择"贡献算力"角色，填写邮箱和密码完成注册。注册完成后在"账号设置"页面生成 Provider Token（与 API Key 不同，专用于 Agent 认证）。

安装并运行 Agent

前往下载页面选择对应平台的版本：

macOS / Linux # 赋予执行权限（Linux） chmod +x infernet-agent-linux-amd64 # 运行 Agent ./infernet-agent-linux-amd64 # 首次运行会提示配置向导： # Platform URL [https://api.infernet.ai]: # Your Provider Token: infernet-pt-xxxx

配置文件说明

Agent 配置保存在 ~/.infernet/agent.json，可手动编辑后重启 Agent 生效：

~/.infernet/agent.json { "admin_console_url": "https://api.infernet.ai", "provider_token": "infernet-pt-xxxx", "dashboard_addr": "127.0.0.1:9090", "heartbeat_interval": "10s", "max_vram_pct": 80, "max_disk_cache_gb": 200, "smart_idle_mode": false }

配置项说明

字段	类型	默认值	说明
`max_vram_pct`	int	80	最大显存占用百分比（0-100）
`max_disk_cache_gb`	int	200	模型缓存最大磁盘占用 GB
`smart_idle_mode`	bool	false	仅在检测到键鼠空闲时接单
`heartbeat_interval`	string	"10s"	心跳间隔，建议不低于 5s
`dashboard_addr`	string	"127.0.0.1:9090"	本地仪表盘监听地址

收益与提现

平台按每完成任务实时计算收益，每小时结算一次到账户余额。分润比例根据节点信誉分动态确定：

信誉分区间	Provider 分润比例	平台抽成
0.9 – 1.0	85%	15%
0.7 – 0.9	80%	20%
0.5 – 0.7	75%	25%
< 0.5	节点被暂停接单，需人工审核

💡 提现门槛为 $50 USDC，支持加密钱包、PayPal、银行转账（各地区支持情况不同）。申请后 1-3 个工作日到账。

支持模型

全部模型列表

以下为当前支持的全部推理模型，持续扩充中。

模型 ID	参数量	上下文	输入价格	输出价格	特点
`llama-3-8b-instruct`	8B	8K	$0.10	$0.15	高速，性价比最优
`llama-3-70b-instruct`	70B	8K	$0.30	$0.50	高质量，多语言
`qwen2.5-7b-instruct`	7B	32K	$0.10	$0.15	中文优化，长上下文
`qwen2.5-72b-instruct`	72B	128K	$0.35	$0.55	最强中文，超长上下文
`deepseek-v3`	671B MoE	64K	$0.45	$0.65	推理能力强
`deepseek-r1`	671B MoE	128K	$0.60	$0.90	链式推理，复杂问题
`mistral-7b-instruct`	7B	32K	$0.10	$0.15	轻量，速度快
`mixtral-8x7b-instruct`	56B MoE	32K	$0.25	$0.40	MoE，高效推理
`codellama-34b-instruct`	34B	16K	$0.20	$0.30	代码专用
`yi-34b-chat`	34B	4K	$0.20	$0.30	中文，多轮对话

价格单位为每百万 tokens（$/1M tokens）。

硬件兼容性

不同硬件支持的模型量化范围不同，Agent 会根据你的设备自动推荐最优配置：

硬件	推荐运行时	支持量化	最大模型
NVIDIA RTX 4090 (24GB)	vLLM	FP16, BF16, Q4	70B Q4
NVIDIA RTX 3060 (12GB)	llama.cpp	Q4_K_M, Q5_K_M	13B Q4
Apple M2 Max (96GB)	llama.cpp (Metal)	Q4_0, Q4_1	70B Q4
Apple M1 (8GB)	llama.cpp (Metal)	Q2_K, Q3_K_S	7B Q2
AMD RX 7900 XTX	llama.cpp (ROCm)	Q4_K_M	13B Q4

账户管理

充值与账单

Infernet 采用预付费模式，需先充值再使用。充值后立即到账，可随时在控制台查看余额和用量明细。

充值方式

💳 信用卡 / 借记卡：Visa、MasterCard，最低充值 $5
💰 加密货币：USDC（以太坊 / Polygon / Solana），最低 $10
📱 支付宝 / 微信支付（中国大陆用户，需企业认证），最低 ¥50

Provider 提现

账户余额 ≥ $50 USDC 时可申请提现
支持 USDC 钱包（ERC-20 / Polygon）、PayPal、银行转账
申请后 1-3 个工作日处理
每月最多提现 3 次

⚠️ 为防止欺诈，首次提现需完成实名认证（KYC），提交身份证或护照照片。