入门指南

快速开始

Infernet 提供与 OpenAI 完全兼容的 API 接口。如果你已经在使用 OpenAI API,只需修改 base_url 即可无缝迁移。

第一步:获取 API Key

前往 注册页面 创建账号,或 登录 现有账号。在控制台的"API Keys"页面点击"创建新 Key"。

🎁 新注册用户自动获得 10 万 tokens 免费额度,无需绑定信用卡即可开始测试。

认证方式

所有 API 请求均需在 HTTP Header 中携带 API Key:

HTTP Header Authorization: Bearer infernet-sk-your_key_here

第二步:发起第一次请求

Infernet API 的 endpoint 为 https://api.infernet.ai/v1,与 OpenAI 格式完全一致:

Python from openai import OpenAI client = OpenAI( base_url="https://api.infernet.ai/v1", api_key="infernet-sk-xxxx" ) response = client.chat.completions.create( model="llama-3-8b-instruct", messages=[ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "What is quantum entanglement?"} ] ) print(response.choices[0].message.content)

Streaming 流式输出

设置 stream=True 开启流式返回,适用于实时对话场景:

Python stream = client.chat.completions.create( model="qwen2.5-72b-instruct", messages=[{"role": "user", "content": "写一首关于AI的诗"}], stream=True ) for chunk in stream: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="", flush=True)

查询可用模型

cURL curl https://api.infernet.ai/v1/models \ -H "Authorization: Bearer infernet-sk-xxxx"

响应示例:

JSON { "object": "list", "data": [ { "id": "llama-3-8b-instruct", "object": "model", "context_window": 8192, "pricing": { "input": "$0.10/1M", "output": "$0.15/1M" } }, ... ] }

限流说明

每个套餐有对应的请求频率限制。当超过限制时,API 返回 429 Too Many Requests,响应头中包含:

HTTP Headers X-RateLimit-Limit: 300 # 每分钟最大请求数 X-RateLimit-Remaining: 245 # 本分钟剩余请求数 X-RateLimit-Reset: 1736650860 # 配额重置时间戳(Unix) Retry-After: 45 # 建议等待秒数

错误码参考

HTTP 状态码错误类型说明
401invalid_api_keyAPI Key 无效或已过期
402insufficient_balance账户余额不足,请充值
404model_not_found指定的模型不存在
429rate_limit_exceeded超过请求频率限制,参考 Retry-After
503no_available_node当前无可用节点,请稍后重试
500server_error平台内部错误,已自动告警
供给方接入

成为 Provider 节点

将你的 GPU 设备接入 Infernet 算力网络,在设备闲置时自动承接推理任务并赚取收益。

注册供给方账号

前往 供给方注册页面,选择"贡献算力"角色,填写邮箱和密码完成注册。注册完成后在"账号设置"页面生成 Provider Token(与 API Key 不同,专用于 Agent 认证)。

安装并运行 Agent

前往 下载页面 选择对应平台的版本:

macOS / Linux # 赋予执行权限(Linux) chmod +x infernet-agent-linux-amd64 # 运行 Agent ./infernet-agent-linux-amd64 # 首次运行会提示配置向导: # Platform URL [https://api.infernet.ai]: # Your Provider Token: infernet-pt-xxxx

配置文件说明

Agent 配置保存在 ~/.infernet/agent.json,可手动编辑后重启 Agent 生效:

~/.infernet/agent.json { "admin_console_url": "https://api.infernet.ai", "provider_token": "infernet-pt-xxxx", "dashboard_addr": "127.0.0.1:9090", "heartbeat_interval": "10s", "max_vram_pct": 80, "max_disk_cache_gb": 200, "smart_idle_mode": false }

配置项说明

字段类型默认值说明
max_vram_pctint80最大显存占用百分比(0-100)
max_disk_cache_gbint200模型缓存最大磁盘占用 GB
smart_idle_modeboolfalse仅在检测到键鼠空闲时接单
heartbeat_intervalstring"10s"心跳间隔,建议不低于 5s
dashboard_addrstring"127.0.0.1:9090"本地仪表盘监听地址

收益与提现

平台按每完成任务实时计算收益,每小时结算一次到账户余额。分润比例根据节点信誉分动态确定:

信誉分区间Provider 分润比例平台抽成
0.9 – 1.085%15%
0.7 – 0.980%20%
0.5 – 0.775%25%
< 0.5节点被暂停接单,需人工审核
💡 提现门槛为 $50 USDC,支持加密钱包、PayPal、银行转账(各地区支持情况不同)。申请后 1-3 个工作日到账。
支持模型

全部模型列表

以下为当前支持的全部推理模型,持续扩充中。

模型 ID参数量上下文输入价格输出价格特点
llama-3-8b-instruct8B8K$0.10$0.15高速,性价比最优
llama-3-70b-instruct70B8K$0.30$0.50高质量,多语言
qwen2.5-7b-instruct7B32K$0.10$0.15中文优化,长上下文
qwen2.5-72b-instruct72B128K$0.35$0.55最强中文,超长上下文
deepseek-v3671B MoE64K$0.45$0.65推理能力强
deepseek-r1671B MoE128K$0.60$0.90链式推理,复杂问题
mistral-7b-instruct7B32K$0.10$0.15轻量,速度快
mixtral-8x7b-instruct56B MoE32K$0.25$0.40MoE,高效推理
codellama-34b-instruct34B16K$0.20$0.30代码专用
yi-34b-chat34B4K$0.20$0.30中文,多轮对话

价格单位为每百万 tokens($/1M tokens)。

硬件兼容性

不同硬件支持的模型量化范围不同,Agent 会根据你的设备自动推荐最优配置:

硬件推荐运行时支持量化最大模型
NVIDIA RTX 4090 (24GB)vLLMFP16, BF16, Q470B Q4
NVIDIA RTX 3060 (12GB)llama.cppQ4_K_M, Q5_K_M13B Q4
Apple M2 Max (96GB)llama.cpp (Metal)Q4_0, Q4_170B Q4
Apple M1 (8GB)llama.cpp (Metal)Q2_K, Q3_K_S7B Q2
AMD RX 7900 XTXllama.cpp (ROCm)Q4_K_M13B Q4
账户管理

充值与账单

Infernet 采用预付费模式,需先充值再使用。充值后立即到账,可随时在控制台查看余额和用量明细。

充值方式

  • 💳 信用卡 / 借记卡:Visa、MasterCard,最低充值 $5
  • 💰 加密货币:USDC(以太坊 / Polygon / Solana),最低 $10
  • 📱 支付宝 / 微信支付(中国大陆用户,需企业认证),最低 ¥50

Provider 提现

  • 账户余额 ≥ $50 USDC 时可申请提现
  • 支持 USDC 钱包(ERC-20 / Polygon)、PayPal、银行转账
  • 申请后 1-3 个工作日处理
  • 每月最多提现 3 次
⚠️ 为防止欺诈,首次提现需完成实名认证(KYC),提交身份证或护照照片。