文件导入

文件导入功能允许您通过手动上传文件更新替换数据。在需要替换或更新部分数据时,该功能将会提供帮助您更快完成该工作。 ByteHouse GUI 界面提供了操作向导来引导对应任务,尽管在 ByteHouse 后台仍执行数据导入任务,但是通过一些优化操作,使得整个流程更加简化

当前支持如下文件类型进行上传:

  • CSV
  • JSON
  • Excel
  • Avro
  • Parquet

请注意:当前通过本地上传的文件最大不能超过 40 MB。

创建文件导入任务

  1. 进入到 数据导入 页面,点击 新建导入任务
1280
  1. 然后在弹窗中选择文件导入任务
2166
  1. 选择本地文件进行上传,也可以通过拖拽本地文件进行上传
1280
  1. 当前支持多种方法来定义文件类型,您也可以选择 基于文件解析来生成 Schema,一旦 Schema 成功生成,您也可以手动进行调整。
    对于 CSV 或者 Excel 格式,如果文件数据不包含表头,表名将默认地以 _cX 格式命名。同时,ByteHouse 会提供一些采样数据作为参考
1280
  1. 选择一个已存在的表进行导入,或者选择新建一个新表。ByteHouse 支持导入时自定义列,对于不需要的列可以选择不进行导入。
1280
  1. 为该导入任务创建名称。完成后,点击创建按钮
1280

查看并编辑文件导入任务

您可以在任务列表页中找到对应的文件导入任务,当任务类型为成功状态时,即可进行数据查询。如果您需要复用已有的配置导入一个新的文件,可以在文件导入任务详情页中创建一个执行作业。注意,再次导入文件时需要确保文件类型和 table schema 和原有配置相同。

2724 2686

如果需要编辑该文件导入任务的配置信息,可以在任务详情页右上角点击编辑按钮,并且更新列名,目标数据库表等配置项。
如果要对已经导入的任务进行排查,可以点击某个执行作业的详情信息,并且查看导入状态和错误日志,便于对导入情况进行判断和优化。

1280