关于开普云信息科技股份有限公司,关于开普云信息科技股份有限公司

爬虫 2
首次公开发行股票并在科创板上市的 审核中心意见落实函的回复 保荐机构(主承销商)二零一九年十一月 8-1-
1 上海证券交易所: 根据贵所2019年11月19日下发的《关于开普云信息科技股份有限公司首次公开发行股票并在科创板上市的审核中心意见落实函》(上证科审(审核)〔2019〕722号)(以下简称“意见落实函”)的要求,开普云信息科技股份有限公司(以下简称“发行人”、“公司”、“开普云”)会同保荐机构国金证券股份有限公司(以下简称“保荐机构”),本着勤勉尽责、诚实守信的原则,就意见落实函所提问题逐条进行了认真核查和讨论,并完成了《关于开普云信息科技股份有限公司首次公开发行股票并在科创板上市的审核中心意见落实函的回复》(以下简称“意见落实函回复”),同时按照意见落实函的要求对《开普云信息科技股份有限公司首次公开发行股票并在科创板上市招股说明书(上会稿)》(以下简称“招股说明书”)等相关文件进行了修订和补充。
如无特殊说明,意见落实函回复中简称与招股说明书中简称具有相同含义,涉及对申请文件修改的内容已用楷体加粗标明。
黑体加粗宋体 楷体加粗 意见落实函所列问题意见落实函所列问题的回复涉及修改招股说明书等申请文件的内容 8-1-
2 问题1请发行人按照《公开发行证券的公司信息披露内容与格式准则第41号——科创板公司招股说明书》的规定,全面梳理‚重大事项提示‛内容,突出重大性,增强针对性,并补充以下事项:报告期内公司主要业务和60%以上的收入来自于为党政机关、企业和媒体提供互联网内容服务平台的建设、运维,并非云计算等意义上的‚云服务‛。
回复:发行人在招股说明书“重大事项提示”之“
一、特别风险提示”和“第四节风险因素”之“
一、经营风险”中修改披露如下:(二)大数据服务收入占比不高及应用未能拓展的风险云计算按照服务模式可以分为三种类型,分别为基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。
公司的大数据服务是构建在阿里云等IaaS平台之上的SaaS服务。
2016年、2017年、2018年和2019年1-6月,大数据服务收入占公司营业收入的比例分别为24.47%、29.03%、25.69%和41.52%,占公司营业收入大部分比例的互联网内容服务平台建设及运维业务不属于云计算服务。
公司大数据服务的主要应用集中于政府门户网站和政务新媒体内容监测领域,应用领域相对单
一,且公司目前在该领域积累了较大规模的客户基数,已经占据较高的市场份额,新增客户数量放缓。
2016年、2017年、2018年和2019年1-6月,大数据服务业务新增客户数量分别为471个、409个、223个和65个;2017年和2018年的收入增速分别为75.74%和28.81%,呈下降态势。
公司如果不能有效拓展大数据服务的应用领域,开发出契合客户需求的更为丰富的大数据服务产品,大数据服务业务将面临新增客户数量和收入增速放缓,甚至收入下滑的风险。
8-1-
3 问题
2 请发行人结合与同行业可比公司的对比情况,以及公司主要收入来自于为党政机关、企业和媒体提供互联网内容服务平台的建设、运维等情况,进一步说明公司核心技术先进性以及招股说明书中‚技术水平处于行业领先地位‛‚在‘互联网+政务’领域取得了较为领先的市场地位‛等表述是否有客观依据,如无,请删除。
请保荐机构核查并发表明确意见。
回复: (一)进一步说明公司核心技术先进性
1、大规模多形态高性能采集技术
(1)该技术具有较为强大的采集能力 基于该技术,发行人大数据服务业务实现了全国政府网站全面、长期、稳定、
高效采集,在最快5分钟、最慢两小时的周期内完成全国政府网站首页和重要栏目的更新检查和网页收录,在24小时的周期内完成全国政府网站的更新检查和网页收录,每天采集网页超过2亿次,总采集有效网页链接超过200亿条,为大规模用户提供了实时监测和预警服务。

(2)与同行业竞争对手相比,该技术在政务内容监测及搜索领域具有先进性 在政务内容监测及搜索领域,发行人从公开信息尚未获知同行业其他公司具 备类似技术。
竞争对手若要构建此技术,最便捷的方式为采用开源爬虫系统。
目 前,开源的大型爬虫技术最具代表性的为
Nutch。
发行人爬虫技术和Nutch爬虫 技术的指标对比如下: 技术指标采集规模 实时性 发行人爬虫技术大规模采集,目前已经支持百亿级网页采集,可以扩展到千亿级5分钟到2小时的周期内完成全国政府网站首页和重要栏目的更新检查和网页收录 Nutch爬虫技术 大规模采集,通过扩展节点可以采集千亿级网页 Nutch基于hadoop技术实现,无法实现大规模网页的实时性采集,采集周期为一天 8-1-
4 技术指标多形态 网页相似性判断网页正文自动提取采集效率 发行人爬虫技术 自动识别静态网页和动态网页,有效降低动态网页采集频次、控制采集成本 通过自有专利技术实现DOM剪枝,结合公司改进的Simhash算法对海量网页进行相似性判断,执行速度快,准确度高基于公司专利技术实现网页正文自动抽取,准确率高 效率高。
采集节点和爬虫服务器通过专用技术进行高效协同工作,单机每天可以采集200万网页,通过增加采集节点可以线性增加采集速度。
Nutch爬虫技术默认只能采集静态网页,需要开发人员识别是否是动态网页并通过配置采集模板实现动态网页采集对网页源码进行指纹提取,通过指纹匹配判断网页是否相似,准确度比较低(目前网页大多数为模板生成,对指纹提取带来干扰)无,所有采集的网页仅仅存储网页源码效率低。
节点间通信和网页消重、链接消重均基于hadoop技术,结构复杂,执行效率低。
单机每天采集网页小于100万,且增加采集节点无法线性提升采集速度。
综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取得4项发明专利,该技术具有先进性。

2、基于平衡语料库的文本智能分析技术
(1)该技术具有较为优越的性能 平衡语料库自动构建技术,极大地降低了人工标注的成本,可以在较短的时间内覆盖较大规模的文本素材,该素材的规模在较高程度上影响了机器学习算法的精度。
目前,发行人平衡语料库覆盖了各行各业出版图书、电子报纸、主流媒体新闻资讯,达千亿字规模的文本素材,训练输出结果包括海量的Bigram/Trigram、依存语法关系,且该等内容的规模仍处在快速增长中,为文本智能分析奠定了坚实的数据基础。
目前,基于无监督方式为主训练的NGram计算,已经接近人工标注的精度;依存关系计算结果的可信度达到80%以上。
基于平衡语料库的新词发现技术,提高了中文分词的准确性,使中文分词在开放语境达到了接近98%的准确率。
基于平衡语料库的敏感规则自动发现技术,提升了新敏感规则发现的及时性,降低了内容安全监测的漏报率以及人工收集敏感规则的成本。
基于平衡语料库的关键词抽取技术,提升了关键词准确度,相当大程度上避免了高频常用词语被误报为关键词的情况,提升了用户体验。
8-1-
5
(2)与同行业竞争对手相比,该技术在政务内容监测及搜索领域具有先进性 由于平衡语料库建设投入较大、周期较长、并不直接产生经济效益,在政务 内容监测领域,发行人从公开信息尚未获知同行业其他公司构建了大规模自主平 衡语料库。
目前,国内比较知名的主要中文语料库和发行人的平衡语料库对比情 况如下: 名称 北京大学语
料库清华大学依存句法语料库 发布时间2000年 2013年 腾讯词向量2018 模型 年 哈工大BERT增强预训练模型 2019年 公司平衡语料库 未公开发布 语料库规模 约2,600万字约20,000句800万词汇,数千亿字 54亿词 近千亿字 内容 1998、2004年人民日报全年文章人工分词 人工标注的两万句句子成分依存关系库 用途用于中文分词 获取方式商业授权 用于句子理解、智能开源问答、文本查错 基于腾讯新闻训练的词向量 用于深度学习词嵌入 开源 覆盖百科、问答、通用新闻的BERT模型 覆盖7万部正式出版物、1,400余种电子报、300万篇高质量新闻和政府稿件 基于谷歌BERT预训练模型的深度学习和文本分析,如句子分类、智能问答中文分词、关键词抽取、文本查错、搜索词纠错、智能问答、新词发现等 开源 公司自用 发行人以平衡语料库为基础,研发了新词、敏感词自动发现以及关键词自动 抽取技术,相比经典算法实现了比较好的抽取效果。
以中国政府网一篇文章为例 (/xinwen/2019-07/30/content_5417355.htm),发行人基于平衡 语料库的关键词抽取效果明显好于经典
TF·IDF算法,具体关键词抽取结果对比 如下: 算法经典TF·IDF算法 发行人算法 关键词抽取结果创新,我国,今年,经济,工业,中国,研发,领域新业态,关键领域,新产业,5G网络,世界工厂,动力电池,商用元年,商用牌照 综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取得2项发明专利和5项软件著作权,该技术具有先进性。
8-1-
6 3、大规模互联网敏感信息实时监测技术
(1)该技术具有较为优越的性能 1)监测准确率高 目前,对于政务领域的严重错误信息,发行人敏感信息、负面信息、错别字
的监测准确率分别在90%、90%、80%以上,达到了较高的实用水平。
2)监测效率高、时效性强 发行人每天采集数亿网页内容,监测技术需要具备较高的执行效率,以便为用户提供及时的监测和预警服务。
单台8核16G内存服务器的敏感信息扫描速度达到50万字/秒,单台16核32G的内存服务器的错别字扫描速度达到10万字/秒,单台8核16G内存16G*2显卡服务器负面信息扫描速度达到10万字/秒,能够满足大规模网页文本实时监测的要求。

(2)与同行业竞争对手相比,该技术在政务内容监测领域具有先进性 超级鹰眼网站诊断监测系统是泰得科技自主研发的“网站智能监测和分析平台”,该平台采用大数据分析技术+人工复核为辅助的方式对政府网站可用性和内容建设情况进行持续地、实时地全景监测和分析,具备错别字诊断、敏感词诊断功能。
泰得科技和发行人敏感信息监测技术指标对比如下: 功能性能 技术指标 错别字 敏感词句子负面信息检测外链/暗链检测隐私/机密信息广告DNS过期 泰得科技 有 有无有无无无 准确率 未知 稳定性 未知 发行人基于公司专利技术,采用深度学习等先进技术构建有有有有有有政务领域的内容监测应用:错别字>80%敏感词>90%句子负面信息>90%长期高并发稳定运行 8-1-
7 技术指标处理速度发明专利 技术 智能文本分析技术 数据规模 服务客户 网页规模语料库规模敏感词规模负面句子训练规模 泰得科技未知无 未知 较少<10亿(从客户规模推断)未知未知未知 发行人>10万字/秒有基于平衡语料库的智能文本分析技术;高效的文本敏感信息识别技术;基于局部上下文特征、依存关系与BERT验证的错别字监测技术;句子负面信息发现技术;众多省级政府、国务院组成部门和直属机构、地级政府 100亿级 近千亿字>40,000个词正负面句子>1,000万句 注:经查询国家知识产权局“中国及多国专利审查信息查询”系统,未发现泰得科技及 其子公司已获得发明专利。
综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取
得1项发明专利和4项软件著作权,该技术具有先进性。

4、政务领域智能搜索技术
(1)该技术具有较为优越的性能 1)构建面向目标网站的语义模型,有效提升用户搜索体验 针对目标网站进行语义分析训练,可以有效解决行业特定词汇、特殊句子成
分搭配关系给搜索造成的干扰,有效提升用户搜索体验。
如在监狱的搜索应用中,“狱警”一词,在监狱行业是常用语,在其他政府网站则较为少见。
中文分词词典事先没有收录“狱警”一词,导致正文中的“狱警”会分为“狱”和“警”两个字索引。
在搜索时输入“狱警”,自动纠错功能可能把该词纠正为常用词“预警”,则无法为用户返回恰当的搜索结果。
2)应用自然语言处理和深度学习技术,全方位提升搜索智能化水平 云搜索智能化水平体现在能够自动判断用户输入字符的组合关系,结合用户 8-1-
8 使用场景做出最佳搜索决策;对于用户输入的口语化词汇,能够自动扩展查询同
义词或官方用语;自动分析用户群体搜索行为,根据大多数用户输入和点击行为的关联关系,为当前用户提供最佳搜索结果;有效识别各种输入错误,自动帮助用户搜索最可能的正确词;为用户返回搜索结果的同时,也提供相关文章智能推荐等。

(2)与同行业竞争对手相比,该技术在政务内容搜索领域具有先进性 拓尔思是国内较早从事政务和媒体垂直搜索的企业,其搜索引擎产品“TRSHybase”目前也是该领域市场占有率较高的产品。
发行人搜索引擎起步相对较晚,近年来依托平衡语料库,引入自然语言处理等先进技术,提供了更多智能化功能,有效提升了用户在政务领域的搜索体验,产品具有较强的竞争力。
TRSHybase和发行人云搜索产品的技术指标对比如下: 技术指标通用语言模型针对网站自动训练语 言模型索引分词分类搜索数据采集智能短语识别和短语 搜索用户画像场景搜索智能queryparser技 术 全网敏感词禁搜功能 文档消重 搜索纠错 权限管理 TRSHybase未知未知 支持字、词混合,可以在召回率和准确度之间自由选择有 文件批量导入,数据库对接,ETL工具未知 支持,算法未知通过应用实现未知 支持配置禁搜词 基于关键词指纹 有 权限控制、物理隔离、逻辑隔离 发行人云搜索有,基于平衡语料库 有,基于公司智能文本分析技术 智能分词,较高查全率,更高的准确度有 爬虫,CMS接口,数据精灵可视化ETL工具 支持 支持,结合用户协作推荐和基于内容的推荐支持 支持 有,基于公司“大规模互联网敏感信息实时监测技术”,敏感词 禁搜功能全面基于分布式Simhash技术有,基于公司“大规模互联网敏感信息实时监测技术”中的错别 字检测技术 细粒度权限控制 8-1-
9 技术指标安全管理SaaS服务 TRSHybase未知无 发行人云搜索IP限制,敏感词禁搜功能,搜索 次数限制提供SaaS搜索服务 综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取得1项发明专利和2项软件著作权,该技术具有先进性。

5、集约化环境下数字内容全生命周期管理技术
(1)该技术具有较为优越的性能 1)海量异构数据和应用服务的一体化管理能力 该技术实现了跨层级、跨部门、跨系统海量多形态异构数据的统一采集、存
储、分析、交换和安全审计的全生命周期管理,为集约化环境下互联网内容服务平台的建设奠定坚实的数据管理技术基础。
2)基于微服务架构的开放和弹性伸缩能力 该技术一方面支持系列标准协议和接口,实现内容服务平台和上层内容应用的分离,简化了上层内容应用开发和数据迁移的技术门槛,扩大了内容管理的应用生态;另一方面基于微服务架构和容器技术部署,可以实现系统秒级扩展,有效提升系统的可扩展性、稳定性和可靠性。

(2)与同行业竞争对手相比,该技术在互联网内容服务领域具有先进性 数字内容管理是一个面向非结构数据的全生命周期的管理技术,由于缺乏国 际通用标准,技术体系较为分散,国际上主要竞争对手为
Oralce、IBM、Mircosoft, 国内主要竞争对手为拓尔思和南京大汉,其技术指标对比具体如下: 技术指标 资源汇聚 元数据管理 多维度资源分类 公司拓尔思Wcm 接口、批处理、ETL、桌面端自 动同步支持,并自动提 取 接口、批处理、ETL 支持 支持 支持 南京大汉 接口、批处理、ETL 支持支持 Oracle的Webcenter 接口、批处理、OCR识别 支持 不支持 Microsoft的SharePoint Portal接口、批处理、OCR识别 支持 不支持 IBM的WebSphere Portal接口、批处理、OCR识 别 支持 不支持 8-1-10 技术指标 分布式存储 存储消重结构化数据提取 协议支持 多渠道发布 静态发布性能 权限控制审计追踪微服务架 构单点登录发明专利 公司 支持 支持 支持 http/https、WebDaV、CIMS、CIFS、RESTFullWeb、微博、微信、头条号、人 民号2,000网页/分 钟 目录级、内容级 支持 支持 支持有 拓尔思Wcm 支持未知支持 Http、RESTFull Web、微博、微信 未知 栏目级支持未知支持 有 南京大汉 支持未知未知 http、RESTFull Web、微博、微信 Oracle的Webcenter 支持未知支持http、WebDaV、CIMS、RESTFull Web Microsoft的SharePoint Portal 支持 未知 支持 http、WebDaV、 CIMS、RESTFull IBM的WebSphere Portal 支持 未知 支持 http、WebDaV、 CIMS、RESTFull Web Web 未知 栏目级支持未知支持 无 无静态发布无静态发布无静态发布 目录级、内容级支持 目录级、内容级支持 目录级、内容级支持 未知 未知 未知 支持有 支持有 支持未查询到 注:经查询国家知识产权局“中国及多国专利审查信息查询”系统,未发现南京大汉已获得发 明专利。
此外,从软件产品在具体应用场景的性能表现来看,发行人技术水平不低于政务服务领域同行业主要竞争对手,具体如下表所示: 8-1-11 指标性能 公司在管理亿级数据的情况下,系统的一般查询服务响应时间在3秒以内;支撑PB级的数据存储;管理后台可以支撑20,000个在线用户的业务请求;前端20,000并发用户相应时间小于3秒;单篇文章发布时间小于1秒(数据来源:西安市政府智能型集约化门户网站平台建设项目公开招标文件);一体化政务服务管理平台,需要满足支持正常10,000个用户同时在线的性能要求;当峰值3,000个用户并发请求同一个中等复杂度的事务时,响应时间不超过2秒;政务服务门户,需要满足支持正常50,000个用户同时在线的性能要求,当峰值20,000个用户并发请求同一个中等复杂度的事务时,响应时间不超过2秒(数据来源:东莞市一体化政务服务平台项目公开招标文件) 拓尔思 南京大汉 科创信息 支持PB级数据;前端1,000并发用户响应时间小3秒;后端并发200并发用户平均响应时间小于3秒;单篇文章发布时间小于1秒(数据来源:天津市政府网站集约化平台开发建设项目竞争性磋商文件) 支持TB级数据,前端1,000并发用户响应时间小3秒;后端并发200并发用户平均相应时间小于3秒;单篇文章发布时间小于1秒(数据来源:江西省级电子政务外网IPV6互联网区和省政府网站集约化平台改造项目竞争性磋商文件)
1、交互类业务平均响应时间:1-3(秒)峰值响应时间:5-10(秒)
2、查询类业务简单查询平均响应时间:1-5(秒)复杂查询平均响应时间:6-15(秒)极限数据查询时间:最大样本量时数据查询时间不超过3分钟
3、统计分析类业务一般统计时间:不超过30秒(数据来源:湖南省生态环境厅湖南省综合政务服务平台项目竞争性磋商文件) 南威软件
1、多用户接入及具有海量数据处理能力,至少支持3,000以上用户接入;实现数据运行达到1亿条以上;
2、多用户并发处理技术,在多用户并发环境下,单用户登录时间≤0.5s、退出时间≤0.1s。
(数据来源:贵阳市政府数据开放平台提升改造工程项目公开招标文件) 8-1-12 指标可用性 公司 系统通过微服务框架的故障隔离技术、集群和负载均衡技术,系统支持99.99%可用性,年平均故障时间小于4小时,平均故障修复时间小于30分钟(数据来源:西安市政府智能型集约化门户网站平台建设项目公开招标文件) 拓尔思 南京大汉 可伸缩、高可用架构,有 效解决信息资源调用高并发服务的一致性、高性能、高可用、敏捷等痛点,年平均故障时间小于4小时,平均故障修复时间小于30分钟(数据来源:天津市政府网站集约化平台开发建设项目竞争性磋商文 平均年故障时间小于12小时;平均故障修复时间小于60分钟(数据来源:江西省级电子政务外网IPV6互联网区和省政府网站集约化平台改造项目竞争性磋商文件) 件) 科创信息 软件的缺陷<0.2%、故障率<0.5%,平均年故障时间<1天,平均故障修复时间<30分钟(数据来源:湖南省生态环境厅湖南省综合政务服务平台项目竞争性磋商文件) 南威软件 平均年故障时间小于12小时;平均故障修复时间小于60分钟(数据来源:贵阳市政府数据开放平台提升改造工程项目公开招标文件) 综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取得2项发明专利,正在申请1项发明专利已取得《授予发明专利权通知书》,获得了10项软件著作权,该技术具有先进性。
8-1-13
6、一体化在线政务服务平台的异构数据交换关键技术
(1)该技术具有较为优越的性能 1)基于版式智能文档的数据交换技术先进性 基于版式智能文档的数据交换技术作为一种人机交互技术,在保留了文档交
互中的用户使用习惯和操作便捷性的前提下,解决了文档流转中数据难以被有效利用的问题,并提供了所交换的结构化数据和非结构化文档的数字签名和加盖电子印章的能力,为实现“一网通办”提供技术支撑。
2)多源异构数据交汇技术先进性 多源异构数据交汇技术针对B/S架构的应用系统,在不需要修改原系统代码、不需要访问原系统数据库、不需要对接原开发厂商的前提下,针对其应用方式快速生成标准访问接口,实现数据的快速采集并统一汇聚至新平台,打通了数据在异构平台之间的流转通道。
该技术大幅降低了原有系统数据的采集难度,低成本聚合第三方服务,实现了数据导流的可追溯、可认证、可管控,高效快速的实现一体化政务服务中的各类服务集成。

(2)与同行业竞争对手相比,该技术在政务服务领域具有先进性 基于版式智能文档的交换技术,是互联网政务服务中的关键支撑技术。
目前 提供政务在线服务的大部分厂商如南威软件、科创信息等采用
Web表单方式来 实现前端和后端的数据交换。
智能文档与Web表单技术指标对比如下: 项目 是否仿真纸面效果 文档格式展示与逻辑数据存储安全控制 数字签名 数据采集方式数据校验方式设计与应用 归档情况 Web表单 Web展示形式,精细度低 HTML紧耦合不存储数据页面级 仅可对内容签名 在线采集在线校验根据不同的终端多次设计不能归档 发行人智能文档完全可仿真纸面效果,符合使用习 惯Xforms版式文档展示与逻辑分离版式和数据可合并或可分离存储文档、页面、字段级别对版式和内容同步签名,防止版式 修改在线和离线采集在线和离线可校验一次设计多终端发布使用版式及数据同步归档 8-1-14 项目设计与输出 文档与数据应用 应用复杂度格式转换 Web表单设计和输出分离文档系统和数据管理系统分离,数据重复录入需要前端工程师完成HTML,其他格式需定制 发行人智能文档设计即打印输出文档流转即数据交换,数据一次录 入多应用使用初级页面设计人员均可设计开发可自动转换成HTML、PDF、Word 关于多源异构数据交汇技术,根据公开信息,国内除发行人外,北京大学和 北京因特睿软件有限公司产学研合作的“云-端融合系统的资源反射机制及高效 互操作技术”(以下简称“因特睿技术”)也具备多源异构数据交汇技术。
二者技 术指标对比如下: 项目
技术构成接口规则 开发平台 运行平台 管理平台接口开发成本 发行人技术开发平台、运行平台、管理平台基于XML技术,少量场合需要一些动态脚本语言
1、基于ElectronJS构建开发界面,使用socks代理捕捉HTTP请求,跨平台支持windows、Linux、macOS,轻量级桌面应用,资源占用率低,2核4G内存PC机可流畅运行
2、开发平台对接口开发人员技术要求低,掌握HTML知识可流畅使用
1、基于静态的XML接口模板和常见脚本语言,运行时无需浏览器,通过HttpClient可模拟各种复杂HTTP/HTTPS请求,内存占用小。

2、运行平台可通过负载均衡技术,将前端用户请求分发到多个并行运行的集群节点,用户会话自动切换到相应服务器节点,从而实现弹性扩容。
基于B/S架构实现,基于NodeJs开发,支持windows、linux、macOS等多种操作系统
1、人员成本低,只需要掌握html2、操作简便,记录操作人员web访问历史,自动生成接口 因特睿技术运行平台、生成平台、管理平台 Java程序语言实现
1、基于eclipseRCP技术,使用SWT技术通过JNI调用本地浏览器,支持windows系统,资源占用率较高,推荐配置4核16G以上的PC机
2、开发平台对接口开发人员要求较高,需要掌握java编程技术,需要掌握eclipse开发环境
1、基于java语言动态编译技术,对编译的代码需要通过classloader动态加载代码,内存开销大。

2、用户请求固定在一个节点,无法自动切换到其他节点,因此实际上无法实现负载均衡,只能手工去划分不同接口到不同服务器,管理配置复杂。
基于B/S架构实现,基于Java开发,支持windows、linux、macOS等多种操作系统
1、人员成本高,需要掌握java编程技术
2、开发平台可生成一些java类模板,需要开发人员在eclipse环境集成的浏览器中去分析网页请求,根据请求参数去修改java类模板,操作复杂 综上所述,该技术在业务大规模应用中的效果良好,发行人基于该技术已取 8-1-15 得3项发明专利,正在申请1项发明专利,获得了5项软件著作权,该技术具有先进性。
(二)招股说明书中‚技术水平处于行业领先地位‛‚在‘互联网+政务’领域取得了较为领先的市场地位‛等表述的客观依据
1、招股说明书中“技术水平处于行业领先地位”表述的客观依据 发行人核心技术先进性的客观依据详见本题“(一)进一步说明公司核心技术先进性”的回复内容。
考虑信息披露的审慎性,发行人将招股说明书中“技术水平处于行业领先地位”修改为“技术水平在政务服务领域具有先进性”。

2、招股说明书中“在‘互联网+政务’领域取得了较为领先的市场地位”表述的客观依据
(1)发行人在互联网内容服务平台建设和政府网站内容监测领域取得了较为领先的市场地位 报告期内,发行人互联网内容服务平台建设业务的客户包括中共中央纪律检查委员会、最高人民检察院等党和国家机构,累计20%左右的省级政府、国务院组成部门和直属机构;大数据服务累计覆盖60%以上的省级政府、40%以上的国务院组成部门和直属机构、40%以上的地级政府。
其中,政府网站集约化平台建设是发行人互联网内容服务平台建设业务的代表性领域,发行人在该领域取得了较为领先的市场地位。
《政府网站集约化试点工作方案》(国办函〔2018〕71号),确定10省(区、市)1市(北京、吉林、安徽、山东、湖北、湖南、广东、广西、重庆、贵州和西藏自治区拉萨市)作为集约化试点地区,要求其2019年12月底前完成政府网站集约化工作。
经查询全国主要政府采购公示网站,10省(区、市)1市中7省(区、市)1市(本级)发布了政府网站集约化建设中标情况信息。
其中,发行人中标3省(区、市)1市的政府网站集约化建设,中标数量排名第一;发行人中标金额为9,250.90万元,中标金额排名第
一。
8-1-16 截至目前,发行人大数据服务已经覆盖全国7,232家政府网站,占全国政府网站数量比例为49.60%,在政府网站内容监测领域取得了领先的市场地位。

(2)参与多项国家级、省级标准规范的制定,并获得多项认可 发行人参与了国家标准《XML在电子政务中的应用指南》(GB/Z19669-2005)的制定,参与了国务院办公厅制定的《政府网站发展指引》(国办发〔2017〕47号)的课题研究工作,参与了北京市、海南省、湖南省、广州市政府网站集约化相关标准规范的制定,是国务院办公厅第一次全国政府网站普查的平台建设和技术支撑单位。
基于发行人大数据服务平台采集的全国政府网站数据的全面、准确和及时性,发行人相关数据为中国互联网信息中心(CNNIC)牵头组织撰写的《第42次中国互联网络发展状况统计报告》、《第43次中国互联网络发展状况统计报告》,清华大学发布的《2018年中国政府网站绩效评估报告》所引用;大数据服务平台被广东省大数据协会、广东软件行业协会评为2019年广东省优秀大数据案例TOP30。
发行人曾获得国家科学技术部等多部门联合颁发的《国家重点新产品》证书,广东省科学技术奖二等奖和东莞市科学技术进步奖
一、二、三等奖;先后承担或参与了10余项国家级或省部级基金项目;获得计算机软件著作权200项;取得发明专利10项,1项发明专利申请取得《授予发明专利权通知书》,1项发明专利申请进入实质性审核阶段。
此外,发行人自2002年至今连续17年(子公司北京开普自2004年至今连续15年)通过《高新技术企业》认证,自2016年至今连续通过了最高级别的软件能力成熟度模型集成CMMI5评估,并取得了质量管理体系(GB/T19001-2016/ISO9001:2015)、信息技术服务管理体系(ISO/IEC20000-1:2011)、信息安全管理体系(GB/T22080-2016/ISO/IEC27001:2013)、知识产权管理体系(GB/T29490-2013)、信息技术服务运行维护标准符合性认证(ITSS-YW-3-440020190685)成熟度叁级等认证,是中国电子工业标准化技术协会信息技术应用创新工作委员会会员单位。
综上所述,发行人在互联网内容服务平台建设和政府网站内容监测领域取得较为领先的市场地位具有客观依据。
考虑信息披露的审慎性,发行人将招股说明 8-1-17 书中“在‘互联网+政务’领域取得了较为领先的市场地位”的表述修改为“在互联网内容服务平台建设和政府网站内容监测领域取得了较为领先的市场地位”。
(三)核查情况及核查意见
1、核查情况保荐机构针对上述事项,履行了以下核查程序:
(1)访谈发行人实际控制人、核心技术人员,查阅发行人产品说明书、同行业公司官方网站等公开信息以及行业相关技术资料,了解发行人核心技术的先进性;
(2)访谈发行人实际控制人、核心技术人员,取得发行人销售明细以及销售合同,查询全国主要政府采购公示网站并统计试点省市政府网站集约化建设的中标单位,查阅了发行人参与的标准规范和获得的奖项认可,核查发行人技术和市场地位表述的客观依据。

2、核查意见经核查,保荐机构认为:发行人核心技术在政务服务领域具有先进性,发行人在互联网内容服务平台建设和政府网站内容监测领域取得了较为领先的市场地位。
问题3请发行人按照互联网内容服务平台建设、大数据服务、运维服务的类别,进一步对收入构成的披露进行修改完善。
回复:发行人已经按照互联网内容服务平台建设、大数据服务、运维服务的类别,对首次公开发行股票并在科创板上市申请文件涉及的收入构成的披露进行修改完善,将“互联网内容服务平台业务”修改为“互联网内容服务平台建设业务”,将“大数据服务平台业务”修改为“大数据服务业务”。
8-1-18 (本页无正文,为《开普云信息科技股份有限公司关于<开普云信息科技股份有限公司首次公开发行股票并在科创板上市审核中心意见落实函>的回复》之盖章页) 开普云信息科技股份有限公司年月日 8-1-19 (本页无正文,为《国金证券股份有限公司关于<开普云信息科技股份有限公司首次公开发行股票并在科创板上市审核中心意见落实函>的回复》之签章页) 保荐代表人: 郭圣宇 王学霖 国金证券股份有限公司 年 月日 8-1-20 国金证券股份有限公司董事长声明 本人已认真阅读关于开普云信息科技股份有限公司首次公开发行股票并在科创板上市审核中心意见落实函的回复的全部内容,了解报告涉及问题的核查过程、本公司的内核和风险控制流程,确认本公司按照勤勉尽责原则履行核查程序,审核中心意见落实函的回复不存在虚假记载、误导性陈述或者重大遗漏,并对上述文件的真实性、准确性、完整性、及时性承担相应法律责任。
董事长: 冉云 国金证券股份有限公司 年 月日 8-1-21

标签: #cad #che #python #舒服 #冷门 #人工智能 #ctrl #华为