替换文本数据中的Tab为空格
存储数据的文本文件中常用空格、Tab、逗号或分号等作为分隔符。一些常用的数据分析工具可能仅接受这些分隔符中的一种,这时便需要将其他分隔符的数据转换为相应工具接受的数据格式。类似的数据准备工作也是实际数据分析工作中相当耗精力的部分。
下面是针对Tab转空格问题的两个方便的解决方案。
- 方法1. sed是常用的方式,可以灵活指定需要替换的内容和目标内容。
sed -i “s/\t/ /g” filename
- 方法2. expand提供了一个方便的替换Tab为空格的工具。
expand -t 1 filename
Usage: expand [OPTION]… [FILE]…
Convert tabs in each FILE to spaces, writing to standard output.
With no FILE, or when FILE is -, read standard input.
Mandatory arguments to long options are mandatory for short options too.
-i, –initial do not convert tabs after non blanks
-t, –tabs=NUMBER have tabs NUMBER characters apart, not 8
-t, –tabs=LIST use comma separated list of explicit tab positions
–help display this help and exit
–version output version information and exit
- Blog Link: http://conxz.net/2020/01/27/tab2space/
- Copyright Declaration: The author owns the copyright (CC BY-NC-ND 4.0).