Есть файл с примерно следующим содержанием:
. . . . | 510,102,003 >MSISDN 380508647904 not found<
2009.06.10 04:42:56| 510,102,003 >MSISDN 380508647904 not found<
2009.06.09 15:30:59| 510,120,016 >ticket error: Problems in FETCH: <No statistics tickets from SMP <x1tmd> with SystemID <10> for 1800 seconds><"
2009.06.09 17:31:32| 510,120,016 >ticket error: Problems in FETCH: <No statistics tickets from SMP <x1tmd> with SystemID <10> for 1800 seconds><"
. . . . | 904,114,002 >SXFW ,OTHER_ERROR:Couldn't get user data for login name XPRESS2 login type 0<
2009.06.10 05:09:31| 904,114,002 >SXFW ,OTHER_ERROR:Couldn't get user data for login name XPRESS2 login type 0<|catched in Login()Хочу дописать shell скрипт для удаления повторяющиеся строк у которых поле даты пустое.
Алгоритм, на сколько я себе это представляю, должен быть примерно следующим:
if [ поле 1 строки 1 содержит " . . . . " && поле 2 строки 1 == полю 2 строки 2 ]
then печатать строку 2
Не могу понять как это реализовать, думал может так
cat filename
if [ `awk -F"|" '{print $1}'` == " . . . . " && `awk -F"|" '{print $2}'` == `awk -F"|" '{print $2}' sed -n '/`awk -F"|" '{print $2}'`/{n;p;}' ` ]
then
или так
cat filename | awk -F"|" '{
if ($1 == " . . . . " && $2 == $2 следующей строки )
print $0
else
print $0
}
Подскажите пожалуйста как это лучше реализовать? самое не понятное для меня - как сравнить второе поле разных строк, на сколько я знаю awk обрабатывает файл построечно, то есть когда он обработывает вторую строку, он уже не помнит первую.