27.4. 文本输入

文本输入组件可以实现从文本文件采集数据。

文本输入组件

图 27.5. 文本输入组件


1、部署点:定位一个文件除了指定文件的路径外,还需要指定是在哪台机器,而部署点就是说该组件部署在哪台AESB或AESB-Agent上,其实也就是指定了是哪台机器。

2、表名:从文本文件中获取回来数据构造的DO名称。

3、文件名:文件的绝对路径(在部署点AESB或AESB-Agent上),多个文件采用“;”分割。

4、编码:文本文件的编码格式,多个文件的情况下,所有文件必须统一编码。

5、固定宽度:列分隔的一种方式,以固定的宽度去截取数据。

6、分隔符:列分隔的一种方式,根据某一个分隔符去截取数据。常见的Tab键,空格,分号,冒号,逗号等都已经给出,注意:分号,冒号,逗号都是英文半角的符号。

文本输入文件

图 27.6. 文本输入文件


从上图看出,该文本文件的第一行是表头,列名分别为id、name、age、sex和score,一共5列。

7、头部行数:指定文本文件的头几行作为头部,在提取数据的时候将忽略。

8、尾部行数:指定文本文件最后几行作为尾部,在提取数据的时候将忽略。

9、数据处理:提取数据过程中的处理策略,默认提供“去除数据前后的空格”的策略,用户可以根据扩展点进行自定义数据处理策略。

10、异常处理:提取数据过程中出现异常的处理策略,默认提供“忽略出错行”的策略,用户可以根据扩展点进行自定义异常处理策略。

11、新字段:从文件中获取的数据以类似数据库的结构存放,新字段和列分隔相关联,一般列分隔后一列代表一个新字段。可以通过设置好自动获取,或自己填写的方式。

12、记录限制数目:每次传输的记录条数限制,0表示不限制。

13、按钮组:从上往下依次是“增加新字段”、“删除新字段”、“自动获取字段”、“预览”。