728x90

Anonymous 구조체

anonyamous 구조체는 이름이 명명되지 않은 구조체인 구조체 멤버이다. 즉 중첩된 익명의 구조체 멤버 구조이다.

ex)

struct person

{

          int id;

          struct { char first[20]; char last[20];};

};

구조체 초기화

struct person ted = {8483, {"Ted", "Grass"}};

 

구조체는 하나의 객체에 여러종류의 데이터를 저장할 수 있기 때문에, 데이터 베이스를 구축하는데 쓰이는 중요한 도구이다. 데이터 베이스 파일은 데이터 객체를 원하는 만큼 가질 수 있다. 이러한 데이터 객체 즉, 구조체에 저장되는 정보의 총 집합을 레코드(record)라 부른다. 각각의 개별 항목을 필드(field)라고 부른다.

 

구조체의 저장된 정보 즉 레코드를 가장 확실하게 저장하는 방법은, fprintf()를 사용하는 것이다.

ex)

fprintf(Fstream, "%s %s   "%.2f\n",primer.title,primer.author, primer.value);

 

위의 방법은 많은 수의 멤버를 가지고 있는 구조체라면 사용하기 어렵다.

 

많은 멤버를 가진 구조체를 파일에 저장할 때 사용하기 좋은 방법은 fread() 와 fwrite()를 사용하여 구조체를 크기 단위로 읽고 쓰는것이다.

주의할 점은 fread()와 fwrite()는 바이너리 모드의 읽기와 쓰기이다.

 

fwrite(&primer, sizeof(struct book),1,Fstream);

위의 함수는 primer 시작 주소로 부터 해당 구조체 크기만큼의 모든 바이트를 Fstream에 연결된 파일에 복사하는 것이다. 위 함수 fwrite()와 fread()함수는 한번에 한 필드를 읽고 쓰는것이 아니라 하나의 레코드를 읽고 쓸 수 있다.

 

바이너리 모드에서 데이터를 저장하는데 단점은 서로 다른 시스템마다 다른 바이너리 모드를 사용할 수 있어 이식성이 낮다.

 

큐(queue), 바이너리 트리(binary tree), 힙(heap), 해시 테이블(hash table), 그래프(graph) 등과 같은 데이터 형들은 구조체를 연결하여 만든다. 일반적으로, 각 구조체는 한두개의 데이터 항목과, 같은 유형의 다른 구조체를 가리키는 한두개의 포인터를 가진다. 이 포인터들은 한 구조체를 다른 구조체에 연결하여, 상용자가 구조체들의 집합 전체를 탐색할 수 있는 경로를 제공한다.

 

공용체

공용체(union)는 같은 메모리 공간에 서로 다른 데이터형들을 저장할 수 있게 한다. 공용체의 용도는, 순서가 규칙적이지 않고 미리 알 수도 없는 데이터형들의 혼합을 저장하도록 설계된 테이블이다.

 

공용체는 구조체와 같은 방식으로 설정한다.

ex)

union hold{

        int digit;

        double bigfl;

        char letter;

};

 

위와 같은 형태의 구조체는 int형 값 1개, double 형 값 1개, char형 값 1개 총 3개의 값을 저장할 수 있지만 union 공용체는 하나의 값 int 또는 double 또는 char형 중 하나의 데이터형태의 하나의 값을 저장할 수 있습니다.

 

hold형 공용체 변수 정의 예시

ex)

union hold fit;

union hold save[10];

union hold * pu;

 

공용체의 경우 컴파일러는 크기가 가장 큰 멤버를 저장할 수 있을 만큼의 공간을 할당 합니다. 공용체 hold의 경우 가장 크기가 큰 멤버는 double 형 이므로 8바이트 메모리를 할당받습니다. 두번째 선언인 고용용체 배열은 가장 큰 멤버의 크기 double형의 메모리공간 8byte 10개짜리 메모리공간을 할당받습니다. 세번째는 공용체 주소를 담을 메모리 공간입니다.

 

공용체 사용

ex)

fit.digit = 23;                     //23이 fit에 저장된다.

fit.bigfl = 2.0;                    //2.0이 23을 대체한다. 8바이트 사용

fit.letter = 'h';                   //'h'가 2.0을 대체한다. 1바이트 사용

 

도트(.) 연산자를 통해 각 멤버의 데이터형을 사용할 수 있다. 한번에 하나의 값만 저장된다. 저장할 공간이 충분하더라도 하나의 값만 사용할 수 있다.

 

공용체 포인터와 구조체 포인터를 사용하는 방법은 같다.

pu = &fit;

x = pu -> digit;

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 34  (0) 2019.06.22
C언어 공부 33  (0) 2019.06.22
C언어 공부 31  (0) 2019.06.16
C언어 공부 30  (0) 2019.06.16
C언어 공부 29  (0) 2019.06.16
728x90

구조체를 함수에서 사용하기

함수의 전달인자로 구조체 자체를 전달할 것인지, 아니면 구조체를 가리키는 포인터를 전달할 것인지 사용자가 선택할 수 있다. 또는 구조체 멤버를 전달인자로 사용할 수 있다.

 

피호출 함수에서 호출함수에 있는 구조체 값에 영향을 주고자 한다면 구조체의 주소나 구조체 멤버의 주소를 전달인자로 넘겨주면 된다. 구조체 주소를 얻기 위해서는 &를 사용해야 한다. 배열 이름과 다르게 구조체 이름은 주소가 아니다.

 

구조체는 같은 데이터형 구조체간에 대입하는 것을 허용한다. 즉 A_data 와 B_data가 같은 데이터형 구조체라면 다음과 같이 대입할 수 있다.

ex) A_data = B_data;

이것은 A_data의 각 멤버에 B_data의 각 멤버의 값이 대입되게 한다.

또한 같은 데이터형의 구조체라면, 한 구조체를 다른 구조체로 초기화 할 수 있다.

struct names right_field = {"Ruthine","George"};

struct names captain = right_field;

 

구조체를 함수의 전달인자로 사용할 수 있고 함수의 리턴값으로도 리턴할 수 있다. 구조체를 함수의 전달인자로 사용하면, 함수에 구조체 정보를 전달할 수 있다. 구조체를 함수의 리턴값으로 사용하면, 피호출 함수로부터 호출 함수로 구조체 정보를 전달할 수 있다.

 

구조체 포인터를 전달인자로 사용하는 것은 주소 하나만 전달하기 때문에 빠르다. 그러나 피호출 함수에서 수행하는 특정 동작에 따라 원본 구조체에 들어있는 값에 영향을 줄 수 있다. 이러한 문제는 함수 전달인자에 const를 넣어 해결 할 수 있다.

 

구조체 안에 문자열을 저장해야 한다면, 문자 배열 멤버를 사용하라. 구조체 안에 char형 포인터는 값 저장을 엉뚱한 곳에 저장하려고 시도할 수 있어 프로그램이 먹통이 될 수 있다.

 

구조체안에 문자열 포인터를 사용하는 바람직한 방법은 malloc()을 사용하여 메모리를 할당하고, 그 주소를 포인터에 보관하는 방법이다.

 

복합 리터럴은 이름이 없는 오브젝트 즉 명명되지 않은 데이터 객체이다. 이러한 복합 리터럴은 함수의 전달인자로 사용되는 구조체나 다른 구조체에 대입되는 구조체를 생성하는데 사용할 수 있다. 복합 리터럴을 사용하여 구조체를 만들 때는 초기화 값 리스트에 적용되는 것과 동일한 신택스 규칙이 복합 리터럴에 적용 되어야 한다.

 

플렉서블 배열 멤버(flexible array member)

구조체의 마지막 멤버가 특별한 속성을 가지는 배열을 가질 수 있다. 이러한 배열 멤버를 플렉서블 배열 멤버라고 한다. 이 배열의 첫번째 특별한 속성은, 플렉서블 배열 멤버가 지금 당장은 존재하지 않는 배열이라는 것이다.

두번째 특별한 속성은, 플렉서블 배열 멤버를 마치 그것이 존재하는 것처럼 그리고 필요한 만큼 원소를 가지고 있는 것처럼, 적당한 코드와 함께, 사용할 수 있다는 것이다.

 

함수의 전달인자로 구조체를 활용할 때는 구조체 멤버를 전달, 구조체 주소로 전달, 구조체 자체를 전달 할 수 있다.

 

플렉서블 배열 멤버를 선언하는 규칙

- 플렉서블 배열 멤버는 구조체의 마지막 멤버가 되어야 한다.

- 다른 멤버가 최소한 하나 있어야 한다.

- 플렉서블 배열은, 각괄호 안을 비워 놓는다는 것을 제외하고, 보통의 배열처럼 선언한다.

ex)

struct flex

{

     int count;

     double average;

     double scores[];

};

 

struct flex 형 변수를 선언하더라도, scores를 사용할 수 없다. scores를 위한 메모리가 할당되지 않았기 때문이다.

이러한 플렉서블 배열 멤버가 있는 구조체는 변수 선언을 의도한 것이 아니라 struct flex형을 가리키는 포인터를 선언하고, struct flex형의 정규 내용들을 저장할 공간과 플렉서블 배열 멤버를 위해 원하는 만큼의 공간을 할당 받기위해 malloc()을 사용하려고 의도하는 것이다.

 

예를 들어 double 형 값 5개 짜리 배열을 scores로 나타내기 위해서

ex)

struct flex *pf;

pf = malloc(sizeof(struct flex)+5*sizeof(double));

로 나타낼 수 있다.

malloc()할당을 통해 count, average, double형 값 5개짜리 배열을 저장할 수 있는 메모리 덩어리가 확보된다. 이후 각 멤버에 접근할 때는 포인터 pf를 사용하여 접근하면 된다.

pf->count = 5;

pf->scores[2] = 18.5;

 

felxible 배열 멤버를 가지고 있는 구조체를 다룰 때는 구조체 대입을 하면 안된다.

ex)

struct flex *pf1, *pf2;

*pf2 = *pf1;

위와 같이 하면 안된다. 위와 같은 대입은 flexible 멤버를 제외한 멤버들만 복사할 것이다. 값을 대입하고 싶을 때는 대입연산자가 아닌 memcpy()를 사용하라.

 

fexible 멤버가 있는 구조체는 구조체 값을 전달하는 함수와 함께 사용하면 안된다. 값을 전달인자로 전달하는 것은 대입과 같다.

flexible 멤버가 있는 구조체를 다른 구조체의 멤버로 사용할 수 없다.

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 33  (0) 2019.06.22
C언어 공부 32  (0) 2019.06.22
C언어 공부 30  (0) 2019.06.16
C언어 공부 29  (0) 2019.06.16
C언어 공부 28  (0) 2019.06.12
728x90

구조체

 

구조체는 특별 배열이다. 하나의 배열에 int형 float형 char형 등등의 데이터가 구분되어 유지된다.

 

구조체 선언

struct book{

       char    title[MAXTITL];

       char    author[MAXAUTL];

       float    value;

};

 

위 선언은 문자 배열 2개와 float 형 변수 1개로 구성된 구조체이다.

위 선언은 실제 데이터 객체를 생성하지 않고, 구조체 구성만 나타낸다. 컴파일러에게 데이터 표현 방법을 알려주지만, 데이터를 위한 기억공간을 할당하지 않는다.

 

구조체 변수(struct variable)

struct book library;

위 문장을 만났을 때 컴파일러는 변수 library를 생성한다. library는 MAXTITL개의 char형 배열과 MAXAUTL개의 char형 배열 , 하나의 float형 변수를 위한 메모리를 할당 받는다. 이것은 library라는 이름으로 한 덩어리를 이룬다.

 

구조체 개별 멤버에 접근하기 위해서 구조체 멤버연산자인 도트(.)를 사용한다. 각 변수에 접근하여 각 변수 데이터형과 동일한 방식으로 사용할 수 있다.

 

구조체 배열 선언

struct book library[MAXBKS];

MAXBKS 개의 원소를 가지는 배열 library를 선언한다. 각각의 원소들은 book형 구조체이다.

 

구조체 배열에서 멤버 식별하기

library[0].value

library[5].title

위와 같이 멤버에 접근 할 수 있다.

 

각원소 하나하나가 구조체 이기 때문에 위와 같이 원소를 통해 해당 구조체를 가리키고 구조체 연산자 도트(.)와 해당멤버의 이름으로 접근하면 된다.

 

library[2].title[4]

위의 값은 library배열의 3번쨰 원소의 title멤버의 5번째 원소를 가리킨다. 즉 하나의 값이다. 구조체도 배열이다. 그렇기 때문에 위와 같이 접근이 가능하다. 도트 연산자 왼쪽 인덱스는 구조체 배열에 적용된다.

->

library

library[2]

library[2].title

library[2].title[4]

위와 같은 순서로 접근한다.

 

구조체 포인터

구조체를 특별배열이라고 했지만 배열의 경우와 다르게 구조체의 이름은 구조체의 주소가 아니다.

struct guy * him;

위처럼 구조체 포인터를 선언해 줄 수 있다.

이후에 구조체 포인터에 포인터 주소를 넣어주면 된다.

him = &barney;

 

구조체 배열을 구조체 포인터에 넣어줄때는

him = &fellow[0];

위처럼 하면 된다. him이 fellow[0]을 가리키고 him+1이 fellow[1]을 가리키게 된다. 구조체 배열 원소 하나의 크기만큼 증가한다.

 

구조체 포인텅서 멤버로 접근하는 방법

1.새로운연산자 -> 를 사용한다.

위의 예시를 빌리면

him->income은 him = &barney의 경우 barney.incom이다.

him == fellow[0]의 경우 him->income은 fellow[0].income이다. 요약하면, 구조체 포인터 뒤에 ->연산자가 오는 것은 구조체 이름에 도트(.)를 쓰는 것과 같다.

 

2.&와 *을 사용한다.

him == &fellow[0]이면, *him == fellow[0]이다. 이것은 &와 *가 서로 상반되는 연산자이기 때문에 가능하다. 이를 통해 멤버로 접근할 수 있다.

fellow[0].income == (*him).income

도트 연산자(.)가 *연산자보다 우선순위가 높아 괄호가 필요하다. him이 barney구조체의 포인터라면

barney.incom == (*him).income == him->income

위 방법들을 통해 멤버에 접근할 수 있다.

 

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 32  (0) 2019.06.22
C언어 공부 31  (0) 2019.06.16
C언어 공부 29  (0) 2019.06.16
C언어 공부 28  (0) 2019.06.12
C언어 공부 27  (0) 2019.06.12
728x90

가장 정확하고 일관되게 수를 저장하는 방법은, 프로그램이 사용하는 비트 패턴과 동일한 비트 패턴을 사용하는 것이다. 그러므로, double형 값은 double 형 크기 하나의 단위로만 저장되어야 한다. 프로그램에서 사용하는 표현과 동일한 표현으로 데이터를 파일에 저장할 때, 우리는 그 데이터가 바이너리 형태(binary form)로 저장된다고 말한다.

fread()와 fwrite()함수가 위와 같은 바이너리 형태의 읽고 쓰는 것을 제공한다.

 

실제로는, 모든 데이터가 바이너리 형태로 저장된다. 문자들도 그 문자 코드의 바이너리 표현을 사용하여 저장된다. 그러나 파일에 있는 모든 데이터가 문자 코드로 해석된다면, 우리는 그 파일이 텍스트 데이터를 가지고 있다고 말한다. 데이터의 일부 또는 전체가 바이너리 형태의 수치 데이터로 해석된다면, 우리는 그 파일이 바이너리 데이터를 가지고 있다고 말한다.

 

size_t fwrite()함수

fwrite()함수는 다음과 같은 프로토 타입을 가진다.

size_t fwrite(const void * restrict ptr, size_t size, size_t nmemb, FILE * restrict fp);

fwrite()함수는 바이너리 데이터를 파일에 저장한다. size_t 형은 C의 표준 데이터형을 사용하여 정의된다. 이 데이터형은 sizeof 연산자에 의해 리턴되는데, 일반적으로 unsigned int형이다. 포인터 ptr는 저장할 데이터 덩어리의 주소이다. 또한 size는 저장할 그 데이터 덩어리들의 크기(바이트 단위)를 나타낸다. nmemb는 저장할 데이터 덩어리들의 수를 나타낸다. fp는 그 데이터가 저장될 파일을 나타낸다.

ex)

char buffer[256];

fwrite(buffer,256,1,fp);

위 호출은 크기가 256인 데이터 덩어리 하나를 buffer로 부터 파일에 저장한다.

 

10개의 double형 값으로 이루어진 배열을 저장하려면, 다음과 같이 할 수 있다.

ex) 

double earnings[10];

fwrite(earnings,size of(double), 10, fp);

이 호출은 10개의 데이터 덩어리를 earnings 배열로부터 파일로 저장한다. 이때 각각의 데이터 덩어리는 double형 크기를 가진다.

 

fwrite()함수는 성공적으로 저장한 항목의 수를 리턴한다. 일반적으로 이 값은 nmemb와 같다.

 

size_t fread()함수

fread()함수는 다음과 같은 프로토 타입을 가진다.

size_t fread(void * restrict ptr, size_t size, size_t nmemb, FILE * restrict fp);

fread()함수는, fwrite()함수가 사용하는 것과 동일한 집합의 전달인자들을 사용한다. 이번에는 ptr이 파일로 부터 읽은 데이터를 저장할 메모리 공간의 주소다. fp는 데이터를 읽을 파일을 나타낸다. fwrite()를 사용하여 파일에 저장된 데이터를 다시 읽기 위해 이 함수를 사용할 수 있다.

 

앞의 예에서 저장된 10개의 double 형 값으로 이루어진 배열을 다시 읽으려면 다음과 같이 호출할 수 있다.

double earnings[10];

fread(earnings,sizeof(double),10,FILE * fp);

이 호출은 double형 크기의 10개의 값을 읽어 earnings 배열에 복사한다.

 

fread() 함수는 성공적으로 읽은 항목의 수를 리턴한다. 일반적으로 이 값은 nmemb와 같다.

 

int feof(FILE * fp)와 int ferror(FILE * fp)함수

 

표준 입력 함수들이 EOF를 리턴할 때, 일반적으로 그것은 파일의 끝에 도달했다는 것을 의미한다. 그러나 이것은 읽기 에러가 발생했다는 것을 의미할 수도 있다. feof()와 ferror()함수를 사용하면 이 두가지 가능성을 구별 할 수 있다.

feof()함수는 마지막 입력 호출에서 파일의 끝을 만나면 0이 아닌 값을 리턴한다. 그렇지 않으면 0을 리턴한다. 

ferror()함수는 읽기 에러나 쓰기 에러가 발생하면 0이 아닌 값을 리턴한다.

 

바이너리 모드의 파일 입출력을 해야한다면 fread()와 fwrite()함수를 바이너리 모드로 사용하라.

텍스트 모드의 텍스트 입출력을 해야한다면 getc(), putc(), fscanf(), fprintf()같은 함수들을 텍스트 모드로 사용하라.

 

어떤 파일에 접근하려면 파일 포인터(FILE *)를 생성하고 이 포인터를 특정 파일 이름과 연결하라. 이후 파일을 다룰 때 파일 이름이 아니라 파일 포인터를 사용하면 된다.

 

'파일의 끝'에 대한 검사는 읽기 시도 직후에 이루어져야 한다. 이유는 C의 입력 함수들은 파일의 끝을 읽고 나서야 그것이 파일의 끝에 도달했다는 것을 인식하기 때문이다.

ex)

int ch;

FILE * fp;

fp = fopen("abc.txt", "r");

ch = getc(fp);

while(ch != EOF)

{

   putchar(ch);

   ch = getc(fp);

}

 

,

int ch;

FILE * fp;

fp = fopen("abc.txt","r");

while((ch = getc(fp)) != EOF)

{

       putchar(ch);

}

 

C프로그램은 입력을 바이트들의 스트림으로 인식한다. 파일, 입력장치, 다른 프로그램의 출력이 스트림의 소스가 될 수 있다.

C프로그램은 출력을 바이트 스트림으로 인식한다. 파일, 비디오, 디스플레이 등이 출력스트림의 타깃이 될 수 있다.

 

fread()와 fwrite() 함수는 바이너리 모드에서 사용된다. 텍스트 모드에선 getc(), putc(), fprintf(), fscanf(), fgets(), fputs() 등을 사용하라.

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 31  (0) 2019.06.16
C언어 공부 30  (0) 2019.06.16
C언어 공부 28  (0) 2019.06.12
C언어 공부 27  (0) 2019.06.12
C언어 공부 26  (0) 2019.06.11
728x90

파일 입력은 stdio.h에 선언되어 있는 fscanf(), getc(), fgets()와 같은 입력 함수들 중 하나를 호출하는 것이다. 이 함수들 중 하나를 호출하면, 한덩어리의 데이터가 파일로부터 버퍼가 복사된다. 일반적으로 512바이트이거나 그것의 배수인 4,096바이트 또는 16,384바이트 이다. 최초의 함수 호출은, 버퍼를 채울 뿐 아니라 fp가 가리키는 구조체에 있는 값들을 설정한다. 특별히, 스트림에서의 현재 위치, 버퍼 안으로 복사된 바이트 수가 설정된다. 일반적으로 현재 위치는 바이트 0부터 시작한다.

 

데이터 구조체와 버퍼가 초기화된 후, 입력 함수는 요청된 데이터를 버퍼로부터 읽는다. 이 과정에서 파일 위치 표시자는 마지막으로 읽은 문자 바로 다음 문자를 가리키도록 설정된다. stdio.h계열의 모든 입력 함수들이 같은 버퍼를 사용하기 때문에, 그들 중 어느 한 함수의 호출은 직전에 이루어진 어느 함수 호출이 행동을 끝낸 위치에서부터 시작한다.

 

버퍼에 있는 모든 문자들을 읽었다는 것을 알게 되었을 때, 입력 함수는 버퍼 크기만큼의 그 다음  데이터 덩어리를 파일로부터 버퍼로 복사하도록 요청한다. 이와 같은 방법으로, 입력 함수들은 파일의 끝까지 파일의 모든 내용을 읽을 수 있다. 마지막 버퍼만큼의 데이터 덩어리에 있는 마지막 문자를 읽은 후에, 입력 함수는 파일 끝지시자를 참으로 설정한다. 그러고 나면 입력 함수의 다음번 호출은 EOF를 리턴한다.

 

출력 함수도 버퍼에 저장한다. 버퍼가 가득 차을 때, 데이터는 파일로 복사된다.

 

int fflush()함수

fflush()함수는 다음과 같은 프로토 타입을 가진다. 

int fflush(FILE * fp);

fflush()함수를 호출하는 것은, 출력 버퍼에 아직 남아있는 데이터를 fp가 가리키는 출력 파일로 보낸다. 이 과정을 버퍼 비우기(flusing buffer)라 한다. fp가 널 포인터면, 모든 출력 버퍼들을 비운다. fflush()를 입력 스트림에 사용하는 것의 영향은 정의되지 않는다.

 

int setvbuf() 함수

setvbuf() 함수는 다음과 같은 프로토타입을 가진다.

int setvbuf(FILE * restrict fp, char * restrict buf, int mode, size_t size);

setvbuf()함수는 표준 입출력 함수들이 사용할 또하나의 버퍼를 설정한다. 이 함수는, 파일을 열고 난 후 그 스트림에 어떤 다른 조작이 가해지기 전에 호출된다. 포인터 fp는 스트림을 나타낸다. buf는 사용할 버퍼를 가리킨다. buf의 값으로 NULL을 사용하지 않는다면, 사용자가 버퍼를 만들어야 한다. 예를 들어, 1024개의 char형으로 이루어진 배열을 선언하고, 그 배열의 주소를 전달할 수 있다. 그러나 buf의 값으로 NULL을 사용한다면, 함수가 직접 버퍼를 할당한다. size 변수는 배열의 크기가 얼마인지 setvbuf()에게 알려준다. mode는 _IOFBF(완전 버퍼링; 버퍼가 가득 찼을때 버퍼를 비운다.) _IOLBF(라인 버퍼링; 버퍼가 가득 찼거나 개행이 쓰여졌을 때 버퍼를 비운다.) _IONBF(비 버퍼링; 버퍼를 사용하지 않는다.)중 어느 하나를 선택한다. 이 함수는 성공하면 0을 리턴하고, 실패하면 0이 아닌값을 리턴한다.

 

크기가 각각 3000바이트인 저장된 데이터 객체들을 다루는 프로그램이 있다고 가정하자. setvbuf()를 사용하면, 버퍼 크기가 데이터 객체의 크기와 일치하는 버퍼를 만들 수 있다.

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 30  (0) 2019.06.16
C언어 공부 29  (0) 2019.06.16
C언어 공부 27  (0) 2019.06.12
C언어 공부 26  (0) 2019.06.11
C언어 공부 25  (0) 2019.06.11
728x90

프로그램이 성공적으로 파일을 열면, fopen()은 파일 포인터(file pointer)를 리턴한다. 다른 입출력 함수들은 그 파일 포인터를 그 파일을 나타내는데 사용한다. 파일 포인터(FILE *fp)는 FILE을 가리키는 포인터 이다.

 

FILE은 stdio.h에 정의 되어있는 유도 데이터형이다. 포인터 fp는 실제 파일을 가리키지 않는다. 대신에 그 파일의 입출력에 사용되는 버퍼정보를 포함하여, 그 파일에 관한 정보가 들어있는 데이터 객체를 가리킨다.

 

표준 라이브러리에 있는 입출력 함수들은 버퍼를 사용하기 때문에, 버퍼가 어디에 있는지 알 필요가 있다. 또한 버퍼가 얼마나 채워져 있는지, 어느 파일을 사용하는지도 알 필요가 있다. 이 정보들은, 필요할때 함수들이 버퍼를 다시 채우거나 비우는 것을 가능하게 한다. fp가 가리키는 데이터 객체가 그 모든 정보를 가지고 있다.

 

fopen()함수는 그 파일을 열 수 없을때 (stdio.h에 정의되어있는) 널 포인터를 리턴한다. 몇가지 예를 든다면, fopen()함수는 디스크가 가득 차 있을 때, 파일이 찾는 디렉토리에 없을 때, 이름이 잘못 되었을 때, 접근이 제한되어 있을 때, 하드웨어에 문제가 있을 때 실패할 수 있다.

 

getc(), putc()함수는 getchar(), putchar() 함수와 아주 비슷하게 작동한다. 차이는, getc()와 putc()는 어느파일을 사용할 것인지 알려주어야 한다는 것이다.

ch=getc(fp) -> "fp가 나타내는 파일로부터 하나의 문자를 얻는다."

putc(ch,fpout) -> "문자 ch를 FIE포인터 fpout이 나타내는 파일에 출력한다."

putc()전달인자 리스트에서, 문자가 앞에오고 파일 포인터가 뒤에온다.

 

stdout은 stdio.h에 표준출력에 연결되는 파일 포인터로 정의되어 있다. 그러므로 putc(ch,stdout)은 putchar(ch)와 동일한 효과를 낸다. 실제로 putchar()는 일반적으로 putc()로 정의되어 있다.

 

파일로 부터 데이터를 읽는 프로그램은, 파일의 끝에 도달했을 때 읽기를 멈출 필요가 있다. getc()함수는, 하나의 문자를 읽으려 시도하다가 파일의 끝에 도달했다는 것을 발견하면, EOF라는 특별한 값을 리턴한다. 그래서 C프로그램은 파일의 끝을 읽은 후에 파일의 끝에 도달했다는 것을 알게 된다.

 

비어있는 파일을 읽으려 시도하는 문제를 피하려면, 진입조건 루프를 파일 입력에 사용해야 한다. getc()(그리고 다른 C의 입력 함수들)의 그와 같은 설계 특성때문에, 프로그램은 루프 몸체에 들어가기전 최초의 읽기를 시도해야한다.

ex)

int ch;

FILE *fp;

fp = fopen("abc.txt","r");

while((ch = getc(fp))!=EOF)                           //루프 들어가기전 진입조건

{

         putchar(ch);                                     //입력 처리

}

 

 

fclose(fp)함수는, 필요할 때 버퍼를 비우면서 fp가 가리키는 파일을 닫는다. fclose()함수는 파일을 성공적으로 닫았으면 0을 리턴하고, 그렇지 않으면 EOF를 리턴한다. fclose 함수는, 디스크가 가득 차있을 때, 플로피 디스크가 제거 되었을 때, 또다른 에러가 발생했을 때 파일을 닫는데 실패할 수 있다.

 

표준 파일을 가리키는 포인터

stdio.h 파일은, 세개의 파일 포인터를 C프로그램이 자동으로 여는 세개의 표준 파일에 연결한다.

        표준파일                              파일포인터                                 일반적으로

 -------------------------------------------------------------------------------------------------------------------------

        표준 입력                               stdin                                        키보드                                                      표준 출력                               stdout                                      스크린                                                      표준 에러                               stderr                                       스크린

위 포인터들은 모두 FILE을 가리키는 포인터형이다. 그래서 이들을 표준 입출력 함수들의 전달인자로 사용할 수 있다.

 

파일 입출력 함수들에게 어느 파일을 가지고 작업할 것인지 알려주기 위해 파일 포인터를 사용할 필요가 있다. getc()와 putc()와 마찬가지로 파일 입출력 함수들은 stdout과 같은, FILE을 가리키는 포인터를 지정할 것을 요구하거나, fopen()의 리턴값을 사용할 것을 요구한다.

 

동시에 열어 놓을수 있는 파일들의 개수에는 제한이 있다. 그 제한은 사용하는 시스템과 컴파일러에 따라 다르다. 일반적으로 그 제한은 10 ~ 20 개 이다. 또한, 파일들을 동시에 열어 놓지 않는다면, 서로 다른 파일에 같은 파일 포인터를 사용할 수 있다.

 

rewind()함수는 파일 포인터를 파일의 시작으로 옮긴다. rewind()는 파일 포인터를 전달인자로 사용한다.

 

fprintf()와 fscanf()함수는 FILE 포인터를 마지막 전달인자가 아니라 첫번째 전달인자로 사용한다.

 

fgets()함수는 세개의 전달인자를 사용한다. 첫번째 전달인자는, gets()와 마찬가지로, 입력을 저장할 주소(type char *)이다. 두번째 전달인자는, 입력 문자열의 최대 크기를 나타내는 정수이다. 마지막 세번째 전달인자는, 읽을 파일을 가리키는 파일 포인터다.

fgets(buf,STLEN,fp);

 

fgets()함수는 최대 문자열 크기보다 적은 수의 문자들을 읽을 때까지 또는 파일끝을 만날때까지 문자들을 읽되, 첫 개행 문자까지 읽는다. 그리고 fgets()는 읽은 것이 문자열이 되도록 종결 널문자를 추가한다. fgets()함수는 EOF를 만나면 NULL값을 반환한다. 이 값을 사용하여 파일의 끝에 도달했는지 검사할 수 있다.

 

fputs()함수는 두개의 전달인자를 사용한다. 첫번째 전달인자는 문자열의 주소다. 두번째 전달인자는 파일 포인터이다. 이함수는 그 주소에 들어있는 문자열을 파일포인터가 가리키는 파일에 기록한다.

fputs(buf,fp);

 

fgets()는 개행 문자를 유지하고, fputs()는 개행 문자를 덧붙이지 않기 때문에, 이들은 서로 협력하여 잘 동작한다.

 

fseek() 함수는, 파일을 마치 배열처럼 다룰 수 있게 한다. 이 함수는 fopen()에 의해 열려진 파일에 들어있는 특정 바이트로 직접 이동할 수 있게 해준다.

 

fseek()는 세개의 전달인자를 사용한다. 첫번째 전달인자는, 처리할 파일을 가리키는 FILE 포인터이다. 이 파일은 fopen()함수에 의해 미리 열려 있어야 한다. fseek()의 두번째 전달인자는 오프셋(offset)이라고 한다. 이 전달인자는 시작 위치로 부터 얼마나 멀리 가야하는지 알려준다. 이 전달인자는 long형 값이어야 한다. 이 값은 양수(앞으로), 음수(뒤로), 0(현재 위치에 머무른다)이 될 수 있다.

세번째 전달인자는 모드(mode)이다. 그것은 시작 위치를 나타낸다. ANSI에서, 모드와 관련된 명단 상수(manifast contant)들은 stdio.h헤더 파일에 정의되어 있다.

           모드                                시작위치

      SEEK_SET                              파일의 시작

      SEEK_CUR                             현재 시작

      SEEK_END                             파일의 끝

 

다음은 fseek() 함수 호출의 몇가지 예이다.

fseek(fp,0L,SEEK_SET);                   //파일의 시작으로 간다.

fseek(fp,10L,SEEK_SET);                  //파일의 시작에서 10바이트 앞으로 간다.

fseek(fp,2L,SEEK_CUR);                 //현재 위치에서 2바이트 앞으로 간다.

fseek(fp,0L,SEEK_END);                //파일의 끝으로 간다.

fseek(fp,-10L,SEEK_END);             //파일의 끝에서 10바이트 뒤로간다.

 

모든것이 성공적이면 fseek()은 0을 리턴한다. 파일의 경계를 벗어나려는 시도와 같은 에러가 있으면 fseek()은 -1을 리턴한다.

 

ftell()함수는 long형이다. 이 함수는 현재의 파일 위치를 리턴한다. ANSI C에서, 이 함수는 stdio.h에 선언되어 있다. ftell()은 파일의 시작으로 부터 첫바이트를 0으로 하는 바이트 수를 리턴함으로써 적용된다. 그러나 텍스트 모드로 열린 파일들에 반드시 적용되는 것은 아니다.

 

텍스트 모드에서 제대로 동작하는 fseek() 호출

       함수 호출                                        효과

fseek(file,0L,SEEK_SET)                        파일의 시작으로 간다.

fseek(file,0L,SEEK_CUR)                       현재 위치에 머무른다.

fssek(file,0L,SEEK_END)                       파일의 끝으로 간다.

fseek(file,ftell-pos,SEEK_SET)               파일의 시작에서 ftell-pos 만큼 떨어진 위치로 간다. ftell-pos는 ftell()이                                                               리턴하는 값이다.

 

fseek()와 ftell()함수들은 파일 크기를 long형으로 나타낼 수 있는 값으로 제한한다. ANSI C는 커다란 파일을 처리하도록 설계된 두개의 새로운 위치 지정 함수를 도입했다. long형 값으로 위치를 지정하는 대신에, 그 목적을 위해 설계된(파일 위치 데이터형을 의미하는) fpos_t라는 새로운 데이터형을 사용한다.

 

ANSI C는 fpos_t를 사용하는 방법을 정의한다. fgetpos()함수는 다음과 같은 프로토 타입을 가진다.

int fgetpos(FILE * restrict stream, fpos_t * restrict pos);

호출되었을 때, 이 함수는 fpos_t값을 pos가 가리키는 위치에 넣는다. 그 값은 파일 안에서의 어떤 위치를 나타낸다. 이 함수는 성공하면 0을 리턴하고, 실패하면 0이아닌 값을 리턴한다.

 

일반적으로, 표준 입출력을 사용하는 첫 단계는 fopen()을 사용하여 파일을 여는 것이다.(그러나 stdin, stdout, stderr 파일들은 자동으로 열린다는 것을 기억하라.) fopen()함수는 파일을 열 뿐만 아니라 버퍼(읽기- 쓰기 모드를 위한 두개의 버퍼)도 설정한다. 또한 이 함수는 파일과 버퍼에 관한 데이터가 들어있는 데이터 구조체를 설정한다. 그리고 다른 함수들이 그 구조체를 어디에서 찾아야 하는지 알 수 있도록 그 구조체를 가리키는 포인터를 리턴한다. 이 값이 fp라는 이름의 포인터변수에 대입된다고 가정하자. 우리는 이것을 fopen() 함수가 "하나의 스트림을 열었다"라고 말한다. 파일을 텍스트모드로 열면, 텍스트 스트림을 얻는다. 파일을 바이너리 모드로 열면 바이너리 스트림을 얻는다.

 

일반적으로 그 데이터 구조체는 스트림의 현재 위치를 나타내는 파일 위치 표시자를 가지고 있다. 또한 그 구조체는 에러와 파일끝을 나타내는 지시자, 버퍼의 시작을 가리키는 포인터, 파일 식별자, 버퍼 안으로 실제로 복사된 바이트 수에 해당하는 카운트도 가지고 있다.

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 29  (0) 2019.06.16
C언어 공부 28  (0) 2019.06.12
C언어 공부 26  (0) 2019.06.11
C언어 공부 25  (0) 2019.06.11
프로그래밍 연습 10  (0) 2019.06.08
728x90

파일 입출력

 

파일에 대한 두가지 입출력 수준(즉, 파일에 대한 접근을 처리하는 두가지 수준)중 어느 하나를 선택할 수 있다. 저수준 입출력(Low-level I/O)은 운영체제가 제공하는 기본적인 입출력 서비스를 사용한다. 표준 고수준 입출력(standard high - level I/O)은 C라이브러리 함수들의 표준 패키지와 stdio.h 헤더 파일정의들을 사용한다.

 

모든 운영체제가 동일한 저수준 입출력 모델로 표현될 수 있다는 보장이 없기 때문에, C 표준은 입출력 패키지만을 제공한다.

 

C프로그램은 사용자를 위해 표준 입력(standard input), 표준 출력(standard output), 표준 에러 출력(standard error output) 이라는 세개의 파일을 자동으로 연다. 표준 입력은 디폴트로, 일반적으로 시스템이 사용하는 키보드와 같은 입력 장치다. 표준 출력과 표준에러 출력은 둘다 디폴트로, 일반적으로 시스템이 사용하는 디스플레이 스크린과 같은 출력 장치이다.

 

표준 입력은 당연히 프로그램에 입력을 제공한다. 그것은 getchar(), gets(), scanf()가 데이터를 읽는 파일이다. 표준 출력은 프로그램의 정상적인 출력이 나타나는 곳이다. putchar(), puts(), printf()가 그 파일을 사용한다. 리다이렉션은 다른 파일들을 표준입력이나 표준 출력으로 인식되게 만든다.

 

표준 에러출력 파일의 목적은 에러 메시지들을 출력할, 논리적으로 구분되는 어떤 장소를 제공하는 것이다. 예를 들어, 출력을 스크린 대신에 파일로 보내는 리디렉션을 사용할 때, 표준 에러 출력으로 보내지는 에러 메시지들은 여전히 스크린에 표시된다. 에러 메시지들 마저도 파일로 보내진다면, 그 파일을 열어보기 전까지는 에러 메시지들의 존재를 알 수 없기 때문이다.

 

표준 입출력 패키지가 저수준 입출력에 비해 가지는 장점.

1. 다양한 입출력 문제들을 간단하게 처리하는 전문화된 많은 함수들을 제공한다. 예를 들어, printf()는 다양한 유형의 데이터를 터미널에 적합한 문자열 출력으로 변환한다.

2.입력과 출력에 버퍼(buffer)를 사용한다. 즉, 정보가 한번에 한바이트씩 전달되지 않고, 큰 덩어리(일반적으로 한번에 512바이트 또는 그이상)로 전달된다.

 

버퍼를 사용

프로그램이 파일을 읽을 때, 한 덩어리의 데이터가 버퍼(중간 저장영역)로 복사된다. 이와 같은 버퍼링은 데이터 전송속도를 크게 증가시킨다. 그러고 나면 프로그램은 버퍼에 들어있는 개별적인 바이트들을 조사할 수 있다. 버퍼링은 무대 뒤에서 은밀하게 이루어진다. 그래서 사용자에게는 문자 단위로 입출력이 이루어지는 것처럼 보인다.

 

exit()함수는 열려있는 모든 파일들을 닫으면서 프로그램을 종료시킨다. 일반적으로 프로그램이 정상적으로 종료되는 경우에는 0을 전달하고, 비정상적으로 종료되는 경우에는 0이아닌 값들을 전달한다. 실패의 여러 원인들을 서로 구별하기 위해 서로다른 종료값들을 사용할 수 있다.

 

ANSI C표준은 정상적인 종료를 나타내기 위해 값 0 또는 매크로 EXIT_SUCCESS 를 사용할 것과, 비정상적인 종료를 나타내기 위해 EXIT_FAILURE를 사용할 것을 요구한다. 이들 매크로는, exit() 프로토타입과 함께, stdlib.h 헤더파일에 있다.

 

fopen()은 파일을 여는 함수이다. 이 함수는 stdio.h에 선언되어 있다. 첫번째 전달인자는 열려고 하는 파일의 이름이다. 좀더 정확하게 말하자면 파일이름을 가지고있는 문자열의 주소이다. 두번째 전달인자는 파일을 여는데 사용할 모드를 지정하는 문자열이다. C라이브러리는 여러가지 모드 문자열을 제공한다.

 

fopen()의 모드 문자열

 

모드문자열                                                                          의미

    "r"                       읽기위해 파일을 텍스트 모드로 연다.

 

   "w"                       쓰기 위해 파일을 텍스트 모드로 연다. 파일이 이미 존재하면 파일 길이를 0으로 만든다.                                         파일이 없으면 새 파일을 만든다.

 

   "a"                       쓰기위해 파일을 텍스트 모드로 연다. 파일이 이미 존재하면 그 파일 끝에 덧붙인다. 파일이                                     없으면 새파일을 만든다.

 

  "r+"                      갱신하기 위해(즉, 읽고 쓰기 위해)파일을 텍스트 모드로 연다.

 

  "w+"                     갱신하기 위해(즉, 읽고 쓰기위해)파일을 텍스트 모드로 연다. 파일이 이미 존재하면 파일길이를                                0으로 만든다. 파일이 없으면 새 파일을 만든다.

 

  "a+"                     갱신하기 위해(즉, 읽고 쓰기 위해)파일을 텍스트 모드로 연다. 파일이 이미 존재하면 그 파일의                                끝에 덧붙인다. 파일이 없으면 새파일을 만든다. 읽기는 전체를 읽을 수 있지만 쓰기는 끝에                                      덧 붙일수만 있다.

 

"rb","wb","ab","ab+"   텍스트 모드가 아닌 바이너리 모드로 동작한다는 것을 제외하고, 앞의 모드들과 같다.

"a+b","wb+","w+b"

"rb+","r+b"

 

"wx","wbx","w+x",      파일이 이미 존재하면 오픈하는것을 실패한다는 것을 제외하고 non-x와 같다.

"wb+x","w+bx"

 

 

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 28  (0) 2019.06.12
C언어 공부 27  (0) 2019.06.12
C언어 공부 25  (0) 2019.06.11
프로그래밍 연습 10  (0) 2019.06.08
프로그래밍 연습 9  (0) 2019.06.02
728x90

파일입출력

 

파일들은 프로그램, 문서, 데이터, 서식, 그래픽, 그밖에도 수없이 많은 종류의 정보를 저장하는데 사용된다.

 

파일(file)은 일반적으로 이름이 붙어있는 디스크 상의, 즉 솔리드 스테이트 디바이스(고체 전기가 흐르는 전자 디바이스로 된 고체 상태 장치)의 어떤 영역이다.

 

운영체제 입장에서 볼때 파일은 조금 복잡하다. 예를들어, 하나의 커다란 파일이 여러영역에 나뉘어 저장되어 있을 수도 있다. 또는 어떤 종류의 파일인지 운영체제가 판단할 수 있는 부가적인 데이터가 파일 안에 들어있을 수도 있다.

 

C는 파일을, 각 바이트를 개별적으로 읽을 수 있는, 연속적인 바이트들의 시퀀스로 인식한다. 이것은 C의 성장 배경이였던 Unix 환경에서의 파일 구조와 일치한다. 다른 환경들은 이 모델과 정확히 일치하지 않을수도 있기 때문에, ANSI C는 파일의 두가지 인식 형식을 제공한다. 즉 텍스트 인식과 바이너리 인식을 제공한다.

 

모든 파일 컨텐츠는 2진법의(바이너리)형태 (0과 1의)이다. 그러나 만일 파일이 C문자열만큼 많은 문자를 표현하기 위해 캐릭터용으로 2진 코드를 사용한다면 그것은 텍스트 파일이다. 텍스트 컨텐츠가 있는것이다.

 

파일안에 있는 2진값들이 기계어 코드 또는 수치데이터(int 값 long값 등등) 또는 이미지나 음악 인코딩을 표현한다면 컨텐츠는 바이너리이다.

 

Unix는 두 종류의 컨텐츠에 같은 파일 포맷을 사용한다. C와 Unix모두 텍스트에 행 바꿈을 나타낼때 \n(개행문자)를 사용한다.

 

텍스트 파일을 처리하기 위한 일부 규칙을 가져오기 위해, C는 파일에 엑세스하는 두가지 방식, 즉 텍스트(text)모드와  바이너리(binary)모드를 제공한다. 바이너리 모드에서, 프로그램은 파일의 각 바이트에 그리고 모든 바이트에 접근할 수 있다.

 

텍스트 모드에서는 프로그램이 인식하는 내용과 파일에 있는 내용이 다를 수 있다.

 

텍스트 파일을 반드시 텍스트 관점으로만 사용해야 하는 것은 아니다. 같은 파일을 바이너리 관점으로도 사용할 수 있다.

 

C가 바이너리 관점과 텍스트 관점을 모두 제공하지만 이 관점들은 이상적으로 적용될 수 있다. 언급된 바와 같이, Unix는 하나의 파일 구조만 사용하므로 Unix에서는 구현할 때 두가지 관점들이 동일해진다. 그리고 이것은 Linux도 마찬가지다.

 

728x90

'Programming > C' 카테고리의 다른 글

C언어 공부 27  (0) 2019.06.12
C언어 공부 26  (0) 2019.06.11
프로그래밍 연습 10  (0) 2019.06.08
프로그래밍 연습 9  (0) 2019.06.02
프로그래밍 연습 8  (0) 2019.06.02

+ Recent posts