跳到主要内容

Jina AI 集成接口指南


概述

本文档介绍 A1 平台与 Jina AI 集成的相关接口函数及参数定义。Jina AI 提供网页内容提取、搜索和文本分割等功能,适用于构建智能数据处理和检索系统。


一、jina_ai_read

功能说明

通过 Jina AI Reader API 从指定 URL 提取结构化的网页内容。适用于需要将网页转换为 LLM 友好格式的场景,如内容采集、知识库构建等。

输入参数

参数名类型必填说明
api_keyString*Jina AI API 的认证密钥
urlString*需要解析的目标网页地址

输出参数

参数名类型说明
titleString网页标题
descriptionString页面描述信息
urlString解析的原始 URL
contentString提取后的网页内容(Markdown 格式)
metadataObject包含页面元信息的对象
resultObject包含外部资源或扩展信息的对象

功能说明

通过 Jina AI Search API 执行智能搜索并返回结构化结果。适用于需要获取高质量搜索结果的场景,如问答系统、信息检索等。

输入参数

参数名类型必填说明
api_keyString*Jina AI API 的认证密钥
questionString*需要搜索的问题或关键词
countryString-搜索的目标国家/地区(如 US、CN)
languageString-搜索的语言(如 en 表示英语、zh 表示中文)

输出参数

参数名类型说明
titleString[]搜索结果中每个条目的标题数组
urlString[]搜索结果中每个条目的链接数组
descriptionString[]搜索结果中每个条目的描述数组

三、jina_ai_split

功能说明

通过 Jina AI Split API 将大段文本内容(如 Markdown、HTML 或纯文本)拆分成更小的块(chunks)。适用于需要将长文本分块进行进一步处理或分析的场景,如 RAG 系统、文档索引等。

输入参数

参数名类型必填说明
api_keyString*Jina AI API 的认证密钥
contentString*需要被分割的原始文本内容
return_tokensBoolean-是否在响应中包含 tokens 信息
return_chunksBoolean-是否在响应中包含 chunks 内容
max_chunk_lengthInteger-每个 chunk 的最大长度,默认为系统设定值

输出参数

参数名类型说明
chunk_positionsNumber[]每个 chunk 在原始内容中的起始位置数组
tokensArray如果启用 return_tokens,则包含 token 数组
chunksString[]如果启用 return_chunks,则包含 chunk 字符串数组

四、使用示例

4.1 网页内容提取流程

4.2 智能搜索流程

4.3 文本分割流程

4.4 完整业务场景


五、注意事项

项目说明
API 密钥api_key 需在 Jina AI 官网 申请
请求限制免费版有请求次数限制,建议合理控制请求频率
URL 格式输入的 URL 需要包含协议(如 https://)
文本长度jina_ai_split 对超长文本可能有处理限制,建议分段处理
错误处理建议对接口返回结果进行异常捕获和处理

如需更多帮助,请参考 Jina AI 官方文档 或联系技术支持。