增量文本输入组件可以实现从文本文件采集增量数据。
1、部署点:参考“文本输入组件”的“部署点”。
2、表名:参考“文本输入组件”的“表名”。
3、文件选择:可以直接指定文件的路径,也可以指定文件夹的路径,然后使用通配符匹配文件。注意,文件的路径是相对于部署点所在机器的。
4、文件选择按钮组:从上往下依次是“文件选择”、“文件夹选择”、“增加文件”、“删除文件”。
5、编码:文件选择中的文件的统一编码格式。
6、记录数:参考“文本输入组件”的“记录数目限制”。
7、头行数:参考“文本输入组件”的“头部行数”。
8、列分隔:参考“文本输入组件”的“列分隔”。
9、行分隔:在数据提取过程中分割一条记录的方式,默认采用“回车/换行”,用户也可以自定义。
10、策略:在数据提取过程中应用到的策略,用户可通过扩展点自定义相应策略。“数据处理”、“异常处理”策略参考“文本输入组件”。
增量处理策略:在对文本进行增量分析的过程中,在获取到一条增量数据前先执行该策略。默认提供“忽略因空格导致的增量变化”,主要用于处理当数据信息没有发生变化,只是格式发生了变化的情况。
11、新字段:参考“文本输入组件”的“新字段”。
主键:逻辑主键,在对文本进行增量分析的过程中,需要根据主键来确定记录的唯一性。