awk로 첫 번째 필드를 사용하는 모든 것을 인쇄

lottoking 2020. 8. 24. 20:37

awk로 첫 번째 필드를 사용하는 모든 것을 인쇄

다음과 같은 파일이 있습니다.

AE  United Arab Emirates
AG  Antigua & Barbuda
AN  Netherlands Antilles
AS  American Samoa
BA  Bosnia and Herzegovina
BF  Burkina Faso
BN  Brunei Darussalam

그리고 순서를 뒤집고 $ 1을 모든 것을 먼저 인쇄합니다.

United Arab Emirates AE

"필드 1을 사용하는 방법 모든 것"

$1작업을 할당 하면 선행 공백이 남습니다.awk '{first = $1; $1 = ""; print $0, first; }'

열 수를 찾아 NF루프에서 사용할 수도 있습니다.

$1=""Ben Jackson이 언급했듯이 공백을 남기는 for루프를 사용했습니다 .

awk '{for (i=2; i<=NF; i++) print $i}' filename

그러므로 "one two three"이면 출력은 다음과 가변됩니다.

둘
셋

결과를 한 행에 표시하려는 다음과 같이 할 수 있습니다.

awk '{for (i=2; i<NF; i++) printf $i " "; print $NF}' filename

이렇게하면 "둘 셋"이됩니다.

다음 옵션 cut과 함께 명령을 사용하십시오 --complement.

$ echo a b c | cut -f 1 -d ' '
a
$ echo a b c | cut -f 1,2 -d ' '
a b
$ echo a b c | cut -f 1 -d ' ' --complement
b c

아마도 가장 간결한 방법은 다음과 가변적입니다.

$ awk '{$(NF+1)=$1;$1=""}sub(FS,"")' infile
United Arab Emirates AE
Antigua & Barbuda AG
Netherlands Antilles AN
American Samoa AS
Bosnia and Herzegovina BA
Burkina Faso BF
Brunei Darussalam BN

설명 :

$(NF+1)=$1: "새"마지막 필드 생성기.

$1="": 원래 첫 번째 필드를 null로 설정

sub(FS,""): 처음 두 작업 후 {$(NF+1)=$1;$1=""}sub를 사용하여 첫 번째 필드 구분 기호를 제거합니다. 최종 인쇄는 암시 적입니다.

awk '{sub($1 FS,"")}7' YourFile

첫 번째 필드와 구분 기호를 제거하고 결과를 인쇄합니다 ( 70이 아닌 값으로 표시됩니다.

awk '{ saved = $1; $1 = ""; print substr($0, 2), saved }'

첫 번째 필드를 설정하면 의 시작 부분에 ""단일 복사본이 남습니다 . 단일 문자 (기본적으로 단일 공백) 라고 가정하면 . 그런 다음 최신 사본을 추가합니다 .OFS$0OFSsubstr($0, 2)$1

Perl 솔루션에 개방적이라면 ...

perl -lane 'print join " ",@F[1..$#F,0]' file

한 공백의 입력 / 출력 구분 기호가있는 간단한 솔루션으로 다음을 생성합니다.

United Arab Emirates AE
Antigua & Barbuda AG
Netherlands Antilles AN
American Samoa AS
Bosnia and Herzegovina BA
Burkina Faso BF
Brunei Darussalam BN

다음은 약간 더 복잡합니다.

perl -F`  ` -lane 'print join "  ",@F[1..$#F,0]' file

입력 / 출력 구분 기호가 두 개의 공백이라고 가정합니다.

United Arab Emirates  AE
Antigua & Barbuda  AG
Netherlands Antilles  AN
American Samoa  AS
Bosnia and Herzegovina  BA
Burkina Faso  BF
Brunei Darussalam  BN

다음 명령 줄 옵션이 사용됩니다.

-n 입력 파일의 모든 줄을 반복하고 모든 줄을 자동으로 인쇄하지 않습니다.
-l 처리하기 전에 줄 바꿈을 제거하고 나중에 다시 추가합니다.
-a자동 분할 모드 – 입력 라인을 @F 배열로 분할합니다. 공백으로 분할하는 재구성
-F autosplit 수정 자,이 예에서는 ''(두 공백)로 분할합니다.
-e 다음 perl 코드를 실행하십시오.

@F는 각 줄에있는 단어의 배열 이며 , 0
$#F으로 시작하는 인덱스 는 단어의 수 @F
@F[1..$#F]입니다. 요소 1부터 마지막 요소까지
@F[1..$#F,0]의 배열 조각입니다. 요소 1부터 마지막 요소와 요소 0을 더한 배열 조각입니다.

gawk (적어도)의 필드 구분 기호는 문자 일뿐 아니라 많은 일 수 있습니다. 데이터가 일관이면 다음과 같이 작동합니다.

awk -F "  " '{print $2,$1}' inputfile

큰 따옴표 사이에 두 개의 공백이 있습니다.

awk '{ tmp = $1; sub(/^[^ ]+ +/, ""); print $0, tmp }'

모든 레코드를 다음 레코드로 이동하고 마지막 레코드를 첫 번째 레코드로 설정하겠습니다.

$ awk '{a=$1; for (i=2; i<=NF; i++) $(i-1)=$i; $NF=a}1' file
United Arab Emirates AE
Antigua & Barbuda AG
Netherlands Antilles AN
American Samoa AS
Bosnia and Herzegovina BA
Burkina Faso BF
Brunei Darussalam BN

설명

a=$1 첫 번째 값을 임시 변수에 저장하십시오.
for (i=2; i<=NF; i++) $(i-1)=$i N 번째 필드 값을 (N-1) 번째 필드에 저장합니다.
$NF=a첫 번째 값 ( $1)을 마지막 필드에 저장합니다 .
{}1awk기본 작업 을 수행 하기위한 true 조건 : {print $0}.

이렇게하면 다른 필드 구분 기호가있는 경우 결과도 좋습니다.

$ cat c
AE-United-Arab-Emirates
AG-Antigua-&-Barbuda
AN-Netherlands-Antilles
AS-American-Samoa
BA-Bosnia-and-Herzegovina
BF-Burkina-Faso
BN-Brunei-Darussalam

$ awk 'BEGIN{OFS=FS="-"}{a=$1; for (i=2; i<=NF; i++) $(i-1)=$i; $NF=a}1' c
United-Arab-Emirates-AE
Antigua-&-Barbuda-AG
Netherlands-Antilles-AN
American-Samoa-AS
Bosnia-and-Herzegovina-BA
Burkina-Faso-BF
Brunei-Darussalam-BN

첫 번째 찌르는 특정 경우에 효과가있는 것입니다.

awk '{ f = $1; i = $NF; while (i <= 0); gsub(/^[A-Z][A-Z][ ][ ]/,""); print $i, f; }'

옵션 1

일부 버전의 awk에서 작동하는 솔루션이 있습니다.

awk '{ $(NF+1)=$1;$1="";$0=$0;} NF=NF ' infile.txt

설명 :

       $(NF+1)=$1                          # add a new field equal to field 1.
                  $1=""                    # erase the contents of field 1.
                        $0=$0;} NF=NF      # force a re-calc of fields.
                                           # and use NF to promote a print.

결과 :

United Arab Emirates AE
Antigua & Barbuda AG
Netherlands Antilles AN
American Samoa AS
Bosnia and Herzegovina BA
Burkina Faso BF
Brunei Darussalam BN

그러나 이전 버전의 awk에서는 실패 할 수 있습니다.

옵션 2

awk '{ $(NF+1)=$1;$1="";sub(OFS,"");}1' infile.txt

그건 :

awk '{                                      # call awk.
       $(NF+1)=$1;                          # Add one trailing field.
                  $1="";                    # Erase first field.
                        sub(OFS,"");        # remove leading OFS.
                                    }1'     # print the line.

지워야하는 것은 FS가 아니라 OFS입니다. $ 1 필드가 서명 라인이 다시 계산됩니다. 그러면 모든 FS 실행이 하나의 OFS로 변경됩니다.

그러나 OFS를 변경하면 분명히 알 수 있듯이 해당 옵션조차도 여러 구분 기호로 실패합니다.

awk -v OFS=';' '{ $(NF+1)=$1;$1="";sub(OFS,"");}1' infile.txt

해당 줄은 다음을 출력합니다.

United;Arab;Emirates;AE
Antigua;&;Barbuda;AG
Netherlands;Antilles;AN
American;Samoa;AS
Bosnia;and;Herzegovina;BA
Burkina;Faso;BF
Brunei;Darussalam;BN

이는 FS 실행이 하나의 OFS로 변경되고 있음을 나타냅니다.
이를 피하는 유일한 방법은 필드 재 계산을 피하는 것입니다.
재 계산을 피할 수있는 기능 중 하나는 sub입니다.
첫 번째 필드를 캡처 한 다음 sub를 사용하여 $ 0에서 제거한 다음 둘 다 다시 인쇄 할 수 있습니다.

옵션 3

awk '{ a=$1;sub("[^"FS"]+["FS"]+",""); print $0, a;}' infile.txt
       a=$1                                   # capture first field.
       sub( "                                 # replace: 
             [^"FS"]+                         # A run of non-FS
                     ["FS"]+                  # followed by a run of FS.
                            " , ""            # for nothing.
                                  )           # Default to $0 (the whole line.
       print $0, a                   # Print in reverse order, with OFS.


United Arab Emirates AE
Antigua & Barbuda AG
Netherlands Antilles AN
American Samoa AS
Bosnia and Herzegovina BA
Burkina Faso BF
Brunei Darussalam BN

FS, OFS를 변경하거나 구분 기호를 더 추가하더라도 작동합니다.
입력 파일이 다음으로 변경된 경우 :

AE..United....Arab....Emirates
AG..Antigua....&...Barbuda
AN..Netherlands...Antilles
AS..American...Samoa
BA..Bosnia...and...Herzegovina
BF..Burkina...Faso
BN..Brunei...Darussalam

그리고 명령은 다음과 같이 변경됩니다.

awk -vFS='.' -vOFS=';' '{a=$1;sub("[^"FS"]+["FS"]+",""); print $0,a;}' infile.txt

출력은 다음과 같습니다 (여전히 구분 기호 유지).

United....Arab....Emirates;AE
Antigua....&...Barbuda;AG
Netherlands...Antilles;AN
American...Samoa;AS
Bosnia...and...Herzegovina;BA
Burkina...Faso;BF
Brunei...Darussalam;BN

명령은 여러 필드로 확장 될 수 있지만 최신 awks 및 --re-interval 옵션이 활성화 된 경우에만 가능합니다. 원본 파일에 대한이 명령 :

awk -vn=2 '{a=$1;b=$2;sub("([^"FS"]+["FS"]+){"n"}","");print $0,a,b;}' infile.txt

다음을 출력합니다.

Arab Emirates AE United
& Barbuda AG Antigua
Antilles AN Netherlands
Samoa AS American
and Herzegovina BA Bosnia
Faso BF Burkina
Darussalam BN Brunei

다른 Perl 솔루션에 열려있는 경우 :

perl -ple 's/^(\S+)\s+(.*)/$2 $1/' file

sed 옵션도 있습니다 ...

 sed 's/\([^ ]*\)  \(.*\)/\2 \1/' inputfile.txt

설명 ...

Swap
\([^ ]*\) = Match anything until we reach a space, store in $1
\(.*\)    = Match everything else, store in $2
With
\2        = Retrieve $2
\1        = Retrieve $1

더 자세히 설명 ...

s    = Swap
/    = Beginning of source pattern
\(   = start storing this value
[^ ] = text not matching the space character
*    = 0 or more of the previous pattern
\)   = stop storing this value
\(   = start storing this value
.    = any character
*    = 0 or more of the previous pattern
\)   = stop storing this value
/    = End of source pattern, beginning of replacement
\2   = Retrieve the 2nd stored value
\1   = Retrieve the 1st stored value
/    = end of replacement

또 다른 방법 ...

... 이것은 FS와 함께 NF를 통해 필드 2를 다시 결합하고 입력 한 줄당 한 줄을 출력합니다.

awk '{for (i=2;i<=NF;i++){printf $i; if (i < NF) {printf FS};}printf RS}'

나는 이것을 git과 함께 사용하여 내 작업 디렉토리에서 어떤 파일이 수정되었는지 확인합니다.

git diff| \
    grep '\-\-git'| \
    awk '{print$NF}'| \
    awk -F"/" '{for (i=2;i<=NF;i++){printf $i; if (i < NF) {printf FS};}printf RS}'

참고 URL : https://stackoverflow.com/questions/4198138/printing-everything-except-the-first-field-with-awk

'IT' 카테고리의 다른 글

Alpine Linux에 Pillow를 사용할 때 디렉토리 디렉토리 "limits.h"없음 (0)	2020.08.24
Yii Framework에 CSS, javascript 파일 포함 (0)	2020.08.24
Spring 현재 ApplicationContext 가져 오기 오기 (0)	2020.08.24
Java Date를 Mysql datetime에 저장하는 방법…? (0)	2020.08.24
데스크톱에 바로 가기 만들기 (0)	2020.08.24

현재글awk로 첫 번째 필드를 사용하는 모든 것을 인쇄

내가 바로 로또왕!

관광, 볼거리, jquery, 자바, 뮤지컬, c++, 여행, 연극, 축제, 공연, C#, spring, 영화순위, javascript, Java, 놀거리, 무비순위, 행사, spring3, DVD순위,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

lottoking