AiOffice 能力组合,开箱即用,为您的工作流提速
USPTO 为专利和商标数据提供专门的 API。按关键字/发明人/受让人搜索专利,通过 PEDS 检索审查历史记录,跟踪作业,分析引文和审查意见通知书,访问商标的 TSDR,进行知识产权分析和现有技术搜索。
UniProt 是世界领先的综合蛋白质序列和功能信息资源。按名称、基因或登录号搜索蛋白质,以 FASTA 格式检索序列,跨数据库执行 ID 映射,通过 REST API 访问 Swiss-Prot/TrEMBL 注释以进行蛋白质分析。
STRING 是一个包含已知和预测的蛋白质-蛋白质相互作用的综合数据库,涵盖 5000 多种生物体中的 59M 个蛋白质和 20B+ 相互作用。查询交互网络、执行功能丰富、通过 REST API 发现合作伙伴以进行系统生物学和通路分析。
PubMed 是美国国家医学图书馆的综合数据库,提供免费访问 MEDLINE 和生命科学文献。使用布尔运算符、MeSH 术语和字段标签构建高级查询,通过 E-utilities API 以编程方式访问数据,以进行系统评价和文献分析。
PubChem 是世界上最大的免费化学数据库,包含 1.1 亿多种化合物和 2.7 亿多种生物活性。按名称、CID 或 SMILES 查询化学结构,检索分子属性,执行相似性和子结构搜索,使用 PUG-REST API 和 PubChemPy 访问生物活性数据。
RCSB PDB 是生物大分子 3D 结构数据的全球存储库。搜索结构、检索坐标和元数据,在 200,000 多个实验确定的结构和计算模型中执行序列和结构相似性搜索。
开放靶标平台是一个综合资源,用于系统识别和优先排序潜在的治疗药物靶标。它集成了公开可用的数据集,包括人类遗传学、组学、文献和化学数据,以建立目标疾病关联并对其进行评分。
代谢组学工作台是一个由 NIH 共同基金资助的综合平台,托管在 UCSD,作为代谢组学研究数据的主要存储库。它提供了对 4,200 多项经过处理的研究(3,790 多项公开可用)的编程访问、通过 RefMet 标准化代谢物命名法以及跨多个分析平台(GC-MS、LC-MS、NMR)的强大搜索功能。
LaminDB 是一个开源生物学数据框架,旨在使数据可查询、可追踪、可重现和公平(可查找、可访问、可互操作、可重用)。它提供了一个统一的平台,通过单个 Python API 将 Lakehouse 架构、谱系跟踪、特征存储、生物本体、LIMS(实验室信息管理系统)和 ELN(电子实验室笔记本)功能结合在一起。
KEGG(京都基因和基因组百科全书)是用于生物途径分析和分子相互作用网络的综合生物信息学资源。
人类代谢组数据库 (HMDB) 是一个全面、免费的资源,包含有关人体内发现的小分子代谢物的详细信息。
GWAS 目录是由国家人类基因组研究所 (NHGRI) 和欧洲生物信息学研究所 (EBI) 维护的已发表的全基因组关联研究的综合存储库。该目录包含来自数千份 GWAS 出版物的精选 SNP 性状关联,包括遗传变异、相关性状和疾病、p 值、效应大小以及许多研究的完整摘要统计数据。
Gene Expression Omnibus (GEO) 是 NCBI 的高通量基因表达和功能基因组学数据的公共存储库。 GEO 包含超过 264,000 项研究,其中来自基于阵列和基于序列的实验的超过 800 万个样本。
NCBI Gene 是一个整合了不同物种基因信息的综合数据库。它提供命名法、参考序列 (RefSeqs)、染色体图谱、生物途径、遗传变异、表型以及全球基因组资源的交叉引用。
通过 openFDA 访问全面的 FDA 监管数据,openFDA 是 FDA 为公共数据集提供开放 API 的举措。使用具有标准化接口的Python查询有关药品、医疗器械、食品、动物/兽医产品和物质的信息。
对跨多个领域的科学数据文件执行全面的探索性数据分析 (EDA)。该技能提供自动文件类型检测、特定格式分析、数据质量评估,并生成适合文档和下游分析规划的详细降价报告。
访问和查询 Ensembl 基因组数据库,这是由 EMBL-EBI 维护的脊椎动物基因组数据的综合资源。该数据库提供 250 多个物种的基因注释、序列、变异、监管信息和比较基因组学数据。当前版本为 115(2025 年 9 月)。
欧洲核苷酸档案库 (ENA) 是核苷酸序列数据和相关元数据的综合公共存储库。通过基因组学和生物信息学管道的 REST API 和 FTP 访问和查询 DNA/RNA 序列、原始读数、基因组组装和功能注释。
DrugBank 是一个综合性生物信息学和化学信息学数据库,包含药物和药物靶点的详细信息。该技能支持以编程方式访问 DrugBank 数据,包括约 9,591 个药物条目(2,037 个 FDA 批准的小分子、241 种生物技术药物、96 种营养保健品和 6,000 多种实验化合物),每个条目有 200 多个数据字段。
COSMIC(癌症体细胞突变目录)是世界上最大、最全面的探索人类癌症体细胞突变的数据库。以编程方式访问 COSMIC 广泛收集的癌症基因组数据,包括数千种癌症类型的数百万个突变、精心策划的基因列表、突变特征和临床注释。