宝软数字 · 实操教程 · 2025-11-02
数据导入是EIOS发挥作用的基础。没有数据,AI Agent就相当于一个没有燃料的引擎。但在点击「导入」之前,有三件事你必须先做好,否则导入过程会反复出错,浪费你的时间。
EIOS支持导入以下格式:Excel(.xlsx/.xls)、CSV(UTF-8编码)、JSON。单个文件最大支持100MB或50万行。如果你的数据超过这个限制,请先拆分成多个文件分次导入。
如果你是财务人员,常见的导入场景是把用友/金蝶导出的财务数据导入EIOS。操作步骤:在用友/金蝶中导出Excel → 检查文件编码(确保是UTF-8,不是ANSI或GBK) → 删除所有合并单元格 → 确保第一行是表头。这最后一步至关重要——合并单元格是EIOS无法识别表头的头号原因。
如果你是销售主管,可能要把CRM中的客户数据导入。注意:EIOS要求每个客户的手机号或邮箱至少有一个是唯一的,用于后续的重复客户去重。如果你的CRM数据中同一个客户有多个联系人,建议先在CRM中合并后导出。
EIOS将数据按业务域分类:销售数据、财务数据、库存数据、客户数据、员工数据、供应链数据、项目数据。导入前先想清楚这份数据属于哪个域。正确的分类会让后续Agent自动匹配正确的分析模型。
创建一份简单的数据字典文档,记录每个字段的含义和数据类型。比如「客户名称」是文本、「销售额」是数字(元)、「日期」是日期格式。这个文档可以帮助你在字段映射时不迷惑,也会让AI更好地理解你的数据含义。
头号坑:编码问题——Windows系统导出的Excel文件默认编码通常是ANSI/GBK,包含中文时直接导入会乱码。解决方法:用Excel打开文件 → 另存为 → 选择「CSV UTF-8(逗号分隔)」格式 → 保存。或者在EIOS导入时选择「GBK」编码(导入界面有编码选择下拉框)。
进入「数据中心」→ 点击右上角「导入数据」按钮,你会看到三种导入方式。下面我们逐一详解操作步骤。
操作步骤:
1. 点击「上传文件」,选择你准备好的Excel或CSV文件。
2. 系统会自动解析文件,在页面左侧显示原始数据预览(前20行)。快速扫一眼,确认数据没有乱码、列数正确。
3. 在页面右侧进行字段映射。系统会自动猜测每个字段对应的业务字段类型,但需要你逐条确认。比如系统可能将「成交金额」识别为通用数字,你应该手动改为「金额-成交金额」。
4. 设置日期列。如果数据包含日期,必须指定哪一列是业务日期(不是导入日期)。这是后续时间序列分析的基础。
5. 选择数据域(销售/财务/库存等),让系统知道这份数据的业务归属。
6. 若勾选「设置为主数据源」,该数据将成为对应Agent的默认分析数据。
7. 点击「开始导入」,等待进度条完成。
如果你的数据已经在MySQL、PostgreSQL或SQL Server中,直连方式可以省去每次导出的麻烦。配置步骤如下:
1. 在「数据源管理」→ 点击「添加数据源」→ 选择数据库类型。
2. 填写连接信息:主机地址(建议使用内网IP)、端口、数据库名、用户名、密码。建议创建一个只读数据库账号给EIOS使用,避免误操作。
3. 如需跨网络访问,可配置SSH隧道。在连接设置中开启「通过SSH连接」,填入跳板机信息。
4. 点击「测试连接」。如果测试通过,系统会列出数据库中的所有表。选择需要导入的表,可多选。
5. 对于每张表,同样需要进行字段映射和日期列指定。然后设置同步频率(实时/每小时/每天/手动)。
6. 保存后,首次会全量导入,之后按照设置的频率增量同步。
在「数据中心」→「API管理」中获取API Key和Endpoint地址。EIOS提供RESTful API,你的开发团队可以用任何编程语言将数据推送到EIOS。详细的API文档在「开发者中心」中查看。
大数据量导入建议:超过10万行的数据,建议使用数据库直连方式而非Excel上传。Excel上传在超过5万行时响应会变慢,且浏览器可能因内存不足而崩溃。如果是必须用Excel上传的大文件,先拆分成多个5万行以内的文件分批导入,然后在系统中使用「合并数据集」功能将它们合并。
字段映射是导入过程中最需要细心对待的环节。如果这一步做错了,后续所有的AI分析都会偏离方向。因为AI是根据字段类型来判断如何使用数据的——它知道「金额」应该做求和分析,知道「日期」可以做趋势分析,但如果把「客户名称」映射成了「数字」,分析结果就全乱了。
EIOS将数据字段分为以下几大类型,每种类型对应不同的分析逻辑:
标识字段:客户ID、产品编号、订单号——用于去重和关联,AI知道这些是唯一标识符。
分类字段:产品类别、销售区域、客户等级——用于分组和对比分析。
金额字段:销售额、成本、利润——AI会做求和、平均值、趋势分析。
数量字段:销售量、库存量、员工数——用于计数和统计分布。
日期字段:交易日期、入库日期、合同日期——用于时间序列和趋势分析。
文本字段:备注、地址、描述——用于关键词提取和语义分析。
以一个典型的销售Excel为例:
列A「订单编号」→ 映射为「标识-订单号」
列B「客户名称」→ 映射为「标识-客户名称」
列C「产品名称」→ 映射为「分类-产品名称」
列D「销售数量」→ 映射为「数量-销售量」
列E「单价」→ 映射为「金额-单价」
列F「总金额」→ 映射为「金额-销售额」
列G「销售日期」→ 映射为「日期-交易日期」
列H「销售员」→ 映射为「分类-人员」
系统会学习你的映射习惯。当你第二次导入同类数据时,会自动复用之前的映射关系,大幅提升效率。
映射省时技巧:如果你有大量同结构文件要导入,第一个文件仔细映射后,点击「保存映射模板」。后续文件导入时直接选用该模板,一秒完成映射。这个功能在财务人员每月导入月报时特别实用。
字段映射完成后,系统会自动进行数据质量检查。这是一个非常智能的功能,能在导入前帮你发现数据问题,避免「垃圾进垃圾出」。
缺失值:关键字段(如销售额、客户名称)存在空值。系统会标记这些行,你可以选择「填充默认值」「删除此行」或「跳过并记录」。
重复行:根据标识字段检测完全重复的记录。你可以选择「保留第一条」「保留最后一条」或「全部导入(标记为重复)」。
格式异常:金额字段中包含文本(如「待确认」)、日期字段格式不一致(如2026/07/09和2025-11-02混用)、数字字段包含特殊字符。系统会尝试自动修正,不能修正的会标红提示。
范围异常:金额出现负数(当预期应为正数时)、数量超出合理范围(如库存量出现10亿)。这些可能是录入错误,也可能是真实数据(如退货金额),需要你人工判断。
1. 系统完成质量检查后,页面顶部会显示数据质量评分(百分制)和问题汇总。
2. 逐条查看系统标出的问题,判断是否需要修正。对于明确的错误(如日期格式错误),可以批量修复。
3. 对于不确定的问题(如金额负数),可以选择「按原值导入,标记为待确认」。导入后可以在数据详情页逐一确认。
4. 清洗完成后,再次点击「开始导入」。
别跳过数据清洗:有用户跟我们反馈说Agent分析结果不准确,追查下来发现导入时一堆数据质量问题被忽略了。数据清洗不是可选项,是必选项。花5分钟清洗数据,比之后花5小时排查分析结果异常要划算得多。
数据导入完成后,你会看到「导入成功」的提示和数据概览(总行数、时间范围、数据域等)。此时你可以设置自动同步,让数据源源不断地流入EIOS,无需每次手动操作。
如果你用数据库直连方式:在数据源设置中已经配置了同步频率。进入「数据源管理」,点击数据源旁的「同步日志」,可以查看每次同步的时间和导入行数。如果同步失败,这里会显示失败原因(如连接超时、表结构变更等)。
如果你用Excel方式:虽不能自动从文件同步,但可以设置「数据更新提醒」。每周或每月的固定时间,系统会发通知提醒你导入最新数据。你只需要把新数据文件拖入即可,系统会自动沿用之前的映射模板。
如果你用API方式:对接完成后数据就是实时流入的,不需要额外设置。在「数据流监控」中可以查看实时数据流入情况。
数据导入完成后,强烈建议做一次快速验证,确保数据正确进入了系统,且可以被Agent正常使用。
验证步骤:
1. 进入「数据中心」→ 找到刚导入的数据集,点击查看。确认行数、时间范围与你预期一致。浏览几行数据,确认数值没有偏差(比如金额没有被错误地除以100)。
2. 进入「Agent中心」→ 找到关联了该数据的Agent → 点击「手动运行一次」。Agent会使用最新的数据进行分析。运行完成后查看报告,确认分析结果合理。如果数据显示「销售额总计」与你预期相差很大,说明导入过程中可能有字段类型映射错误。
3. 检查图表是否正确生成。如果某个应该显示折线图的指标变成了空白,说明对应的日期字段可能没有被正确识别。回到数据集详情页,检查日期列的字段类型。
4. 如果你创建了多个数据集,可以试试「关联查询」功能。在数据中心选择一个数据集,点击「关联分析」,选择另一个数据集和关联字段(如产品编号),系统会生成跨数据集的联合分析。
验证清单:导入后务必确认这三点——(1)总行数是否正确(2)金额/数量是否与原文件一致(3)日期是否被正确识别。这三样对了,后续分析基本不会有大问题。如果发现错误,在数据集详情页点击「重新导入」,修正映射后重新上传即可覆盖。
数据导入完成!有了数据,你的Agent就能真正发挥价值了。下一篇教程我们将讲解权限设置,让老板、经理、员工各自看到该看的数据,确保企业信息的安全与合规。