SPDB(ZJ)-202409005-关于“浦发银行基于大模型的知识工程建设项目之知识工程平台产品采购“供应商征集公告
上海浦东发展银行总行
基于大模型的知识工程建设项目之知识工程平台产品采购供应商征集公告
一、 采购名称
基于大模型的知识工程建设项目之知识工程平台产品采购
二、 征集时间
2024年9月25日-2024年9月30日
三、 项目需求
本次基于大模型的知识工程产品采购,要求产品满足信创要求,通过引入成熟知识工程平台产品,与浦发银行模型服务与管理平台、统一身份认证与管理系统、大模型创设平台及向量化数据库等集成,提供面向浦发银行的大模型体系化应用能力,支撑浦发银行大模型应用场景建设。
产品需要具备完善的知识库构建和运营管理能力,承接知识库构建的大规模数据实时和批量接入、智能化知识预处理、灵活且便利的知识切分、自动化知识增强等应用需求,产品本身需要具备高性能知识库调用和安全管理,保证大模型场景下高效、安全的知识库调用。同时产品需要具备大模型训练场景下微调数据的智能化标注能力,支撑大模型应用场景下各种微调训练场景。
除此之外,产品需支持浦发银行信创云环境部署以及接口二次开发,通过运用本产品与行方模型服务与管理平台、统一身份和访问管理系统等系统集成,最终满足面向浦发银行的智能、便捷、安全、可靠的知识工程能力服务。
供应商具备基于产品,开展知识库构建,具备大模型训练语料标注能力以及系统集成相关要求,以及配套提供完备的知识工程整体解决方案,承接大模型应用全部场景下的知识工程需求。具体详细要求如下:
(包括业务需求、技术需求、非功能性需求、维保需求、实施团队规模、人员资质要求等)
(一) 业务需求
1. 支持接入结构化、非结构化数据
(1) 支持数据源接入方式包括但不限于:批量导入 、本地上传、API推送或拉取、数据湖、应用回流、对接浦发银行现有知识库等;
(2) 支持多种数据格式,包括但不限于 pdf、doc、docx、txt、csv、json、excel等;
(3) 支持对接浦发银行现有数据系统,包括但不限于大数据平台、数据仓库、数据湖等;
(4) 支持对接入的数据进行批量或实时的更新,更新频率可包括日、周、月等。
2. 支持对数据进行预处理,包括但不限于以下功能
(1) 提供知识切分前的数据清洗,包括非结构文本去重、敏感信息脱敏、异常文本检查、文本信息过滤、文本缺失填补、文本标准化、文本格式检验等;
(2) 支持文本格式转换,通过算子将原始数据源格式转换为目标格式,如doc转docx、pdf转docx等;
(3) 提供知识切分前的文档解析功能,支持版面分析,支持文档内表格识别、表头识别、文字识别、图片识别等。
3. 支持文本切分,包括但不限于以下功能
(1) 支持段落、定长、章节、分隔符、递归等默认方式切分;
(2) 支持支持用户进行切分规则或参数的配置实现自定义切分,并执行切分。
4. 提供基于大模型的知识增强能力,包括但不限于以下功能:
(1) 支持QA生成,生成模式包括但不限于基于文档生成、基于知识片段生成、基于历史问题及文本生成等;
(2) 支持摘要生成,支持对生成的摘要进行编辑和修改;
(3) 支持文本润色,能够对文本进行改写、扩写;
(4) 支持通过大模型实现知识抽取,抽取场景包括关键词抽取、文档关系标注、主题抽取、标题抽取、标签抽取等多标签抽取能力以及三元组抽取能力。
5. 支持对知识进行向量化,包括但不限于以下内容
(1) 提供词、句、段落、篇章、通用级的词嵌入模型能力;
(2) 支持用户对向量化模型进行选择和配置。
6. 支持对大模型训练数据进行标注
(1) 支持通过标注构建大模型微调训练所需语料,支撑应用于预训练、微调、强化学习等阶段的数据构建;
(2) 支持通过标注构建大模型微调训练所需语料,支持通过标注构建大模型微调训练所需语料;
(3) 支持通过数据清洗加工构建大模型预训练所需语料。
7. 支持对加工后的知识进行发布形成数据库,包括但不限于以下内容
(1) 提供知识库融合构建的能力,支持已发布公共知识库为基础构建新的知识库,支持融合FAQ、知识条目、知识文档构建并发布知识库;
(2) 提供知识库私有/共享发布的能力,根据隐私情况支持私有或共享发布;
(3) 提供知识库反馈更新的能力,支持支持应用回流数据的入库更新知识库;
(4) 支持将发布后的知识库提供标准化的服务接口供外部进行访问和调用。
8. 支持对知识存储进行选择和配置
(1) 支持存储加工后的FAQ型数据、知识条目型数据;
(2) 支持对向量数据库的存储配置,提供对关系型数据库、图数据库、非关系型数据库等其他数据库的存储配置。
9. 具备知识检索能力,包括但不限于以下内容
(1) 提供面向知识库的检索召回能力,支持全文、语义检索、关键词、混合检索等多种检索模式,支持用户对阈值、检索条数等检索参数进行配置;
(2) 提供基于rerank精排模型的检索重排能力,支持用户自由选择rerank模型类型,支持用户对阈值、返回数目等重排参数进行配置;
(3) 提供对已配置检索方式的验证能力,支持基于配置的检索参数和重排参数进行检索的效果测试或命中率测试,支持计算检索的准确率。
10. 支持对知识库的用户及资源权限管理,包括但不限于以下内容
(1) 用户管理:
1) 支持单个及批量增删改查用户、用户组、用户属性;
2) 支持自定义用户属性扩展和批量修改;
3) 支持指定任意用户或用户组,可以页面展示这些用户或用户组,能够可见/编辑哪些知识库。
(2) 角色管理:
1) 支持对平台中已有角色,进行功能权限配置;
2) 支持创建自定义角色,进行功能模块的权限分配;
3) 支持指定任意角色,可以页面展示这些角色具有哪些功能权限。
(3) 资源管理:
支持对平台中的所有知识型数据(知识库中FAQ、知识条目等知识类型)进行权限管理;
11. 支持对知识质量进行审核检查,包括但不限于以下内容
(1) 支持在数据入库前进行审核;;
(2) 支持对知识的重复性、准确性等维度进行校验审核,提供多种粒度的审核,如文档级、QA级、知识条目级;
(3) 可支持半自动化或人工审核模式。
12. 支持对数据权限进行管控,包括但不限于以下内容
(1) 知识库整库级数据权限管控;
(2) 知识库中FAQ级权限管控;
(3) 知识库中知识条目级权限管控。
13. 支持平台运维及运维管理,包括但不限于以下内容
(1) 运维管理:
l 支持对服务器硬件资源的监控以及报告生成,资源包括但不限于CPU使用率、内存使用率、磁盘使用率。
(2) 知识运营管理:
l 支持对平台用户行为数据的全量采集、知识库访问量和调用量的智能分析以及可视化展示。
14. 产品具备二次开发能力,包括但不限于以下内容
(1) 前端展示:
支持知识审核流程界面化。
(2) 后端服务:
l 支持用户组、用户组用户、用户角色及其资源权限与其他系统自动实时同步;
l 支持提供用户行为日志、应用报错日志接口供第三方系统调用;
l 支持适配浦发银行已部署的开源大模型、向量化模型、精排模型以及后续浦发银行指定的商用大模型;
l 工具还提供其他各类丰富API。
(二) 技术需求
1. 支持容器化部署,满足浦发银行软硬件及信创要求
产品需具备云化部署能力,支持基于浦发银行华为云(HCSO)及通用公有云上裸金属服务器、虚机及容器环境部署,同时平台自身架构方面需实现存算分离,提供灵活扩展、弹性伸缩的能力。
2. 产品性能
产品需提供资源控制要求,支持单个知识库200并发的用户需求,支撑知识库低于1秒的响应时间。
3. 技术安全
产品需符合行内系统安全要求,涉及到操作系统、存储系统、数据库接口、对外部的网络传输均执行行内安全标准,符合行内数据安全管理规范:
(1) 数据安全层面,需要具备数据存储加密、数据脱敏等功能,保障数据生命周期安全;
(2) 用户安全方面,需要对接浦发银行统一身份认证系统开展身份认证;
(3) 用户使用层面,需要支持系统管理员、知识库管理员、标注员、审核员及游客的五级权限管理,同时支持知识库表级用户调用授权、以及权限回收等管理体系,全方面保障用户数据安全,避免数据泄露;
(4) 其他方面,需要支持以数据为中心的安全审计功能,包括数据操作审计、异常行为阻断等功能需求。
(三) 非功能性需求
1. 产品维护服务要求
(1)提供7×24×2小时(2小时到场)上门服务;
(2)提供专用报修电话;
(3)提供一名原厂专署技术客户经理跟踪整个服务事件以及紧急派遣,在客户自定义严重程度为最高的情况,专署技术客户经理提供与电话支持同步的现场故障诊断。
2. 产品售后服务要求
需满足以下评价指标项目的年度服务承诺,也可在此基础上提供更高水平的服务承诺。实际服务承诺,备件更换时间,人员资质数量,备件库等等。
1)现场相应时间:在规定的时间内到达现场,比例>=95%;
2)故障修复时间:7×24故障修复时间:24小时内结单,比例>=85%;
3)同一组件故障的重复维修时间:同一组件在修复后30天内不会发生故障>=95%;
4)故障诊断的准确性: 在日志完整的情况下,1次诊断正确>=85%;
5)维修规范和流程的合规性:必须保证,比例为100%;
6)用户满意度:最高级别,比例为>90%。
3. 增值服务要求
(1) 系统集成:应具备与行方周边系统集成对接,包括但不限于行方现有模型服务与管理平台、统一身份和访问管理系统、高管信息及数据服务管理平台、通用云管平台、大数据服务平台等;
(2) 大模型适配:应具备与大模型集成对接,包括但不限于开源大模型(Qwen2.0、ChatGLM4),业务主流商用大模型,以及浦发银行后续指定使用的开源及商业大模型;
(3) 模型部署:应具备与涉及到的OCR模型、向量化模型、精排模型、检索类算法模型等功能支撑类模型算法,须支持集成部署于行方现有模型服务与管理平台。
4. 安全性保障要求
(4) 数据安全:密码等敏感数据应加密存储和加密传输,屏蔽显示敏感信息;
(5) 高危漏洞:系统不存在高危漏洞,包括SQL注入、XSS跨站脚本,木马文件上传、远程命令执行、任意文件下载、越权、暴力破解、短信炸弹等。
四、 合格服务供应商基本资质要求
1.具有中华人民共和国境内独立法人资格的企业,持有工商行政管理部门或市场监督管理部门登记的《营业执照》,且《营业执照》经营(许可)范围与本项目相符。
2.企业注册资本不低于10,000万元人民币(或等值);
3.近三年内(从2021年9月1日起至今),须具有国内系统重要性银行(中国工商银行、中国银行、中国建设银行、中国农业银行、交通银行、招商银行、兴业银行、中信银行、中国邮政储蓄银行、浦发银行、中国民生银行、中国光大银行、平安银行、华夏银行、宁波银行、广发银行、江苏银行、上海银行、北京银行、南京银行,下同)项目的成功案例;
4.近三年内(从2021年9月1日起至今),须具有国内系统重要性银行)或其他全国性大型证券、保险机构大语言模型领域实施的成功案例;
5.报名供应商须为产品的制造商(原厂商)或其合法代理商;如为代理商,须提供制造商(原厂商)针对本项目的授权,制造商(原厂商)只能授权一家代理参加本项目,同一品牌的制造商(原厂商)和代理商不得同时参与本项目报名,代理商提供产品厂商(即原厂)对本项目的授权书和有效的代理商符合资格要求的证明材料,授权书应明确原厂对本项目所有报价项的承诺(提供制造商授权书和代理商资格证明);
6.不接收联合体的申请。
五、 供应商报名提交资料
1.有效期内的公司营业执照、组织机构代码证、税务登记证(如果已经是三证合一,则只需要提供营业执照);
2.加盖公章的参与本项供应商征集的确认函(扫描件,确认函模版见附件1);
3、填制供应商信息表(扫描件,模版见附件2);
4.公司简介(包括但不限于公司综合能力、财务能力、服务能力等内容介绍);
5.其他本次项目要求满足度证明材料。
六、 报名资料提交方式
相关材料通过电子邮件发送我行联系人邮箱。
七、 声明
1.我行接受报名并不表示接受报名供应商参与本项目后续采购等工作;且我行有权对供应商征集审核结果不做任何说明;
2.供应商须对提供的所有信息的真实性负责;
3.在审核过程中,我行集中采购部门如认为必要,将安排对供应商进行实地考察、邀请参加POC测试等;
4.采购人保留要求报名服务供应商补充提交资料的权利;
5.本次公开征集不收取供应商任何费用。
八、 联系人及联系方式
联系人(一):徐老师(采购部联系人)
电话:021-61618016
邮箱: xuj47@spdb.com.cn
联系人(二):阮老师(采购申请部门联系人)
电话:021-31868138
邮箱:ruanq@spdb.com.cn
上海浦东发展银行股份有限公司
二〇二四年九月二十五日
参与XXXX采购供应商征集的确认函
致:上海浦东发展银行
我公司在此确认,将参加贵行XXXX采购的供应商征集,并同意按照有关供应商征集的要求配合贵行开展工作。
此致
[签署栏]
确认公司(公司名称及公章) |
法定代表人或授权代理人(签字或盖章) |
营业执照编号 住所地 邮编 联系人 |
签字人职务 签署日 电话 传真 |
附件2:
供应商信息表
1、公司名称:
2、法人代表:
3、注册资金:
4、控股股东:
5、成立日期:
6、上一年度营业额:
7、信息获取渠道:招标投标公共服务平台/浦发官网/金采网等
8、联系人姓名:
9、联系人电话:
10、联系人邮箱: