自分で調べるCのポインタ

#rst2hooktail_source ============================================================ 自分で調べるCのポインタ ============================================================

C言語のポインタについて前橋さんの詳しい解説がありますが[2], Cの開発環境 があれば,手持ちの教科書・参考書を参照しながらテストプログラムを作ること により,自分で疑問点を調べることができます.以下の例を変更していろいろ 試みてください.本文に誤りがあったとき自信を持って訂正できます.

簡単な例 =================================================

まず次の例を考えましょう.結果が予想できない人は実際にプログラムを 作って実行してください.

例1. 次のプログラムの出力は「 ``1, 4`` 」.

::

 #include <stdio.h>
 int main(void)
 {
   int n[3]={4, 5, 6}, *p=n;
   printf("%d, %d\n", p==&n[0], *p);
   return 0;
 }

問1. 例1の ``n, p`` について

(1) ``p[1]`` の値を示せ. (2) ``&n[1]-&n[0]`` の値を示せ.

例1で実在する変数は ``n[0], n[1], n[2], p`` のみですが,「 ``p=n;`` 」によって ``n[i]`` の代わりに ``p[i]`` を使うことができます.一般に

 ``p[i]==*(p+i), &p[i]==p+i``

したがって ``p==&p[0],*p==p[0]`` であり,「 ``p=n+1;`` 」とすると

 ``p[-1]==n[0], p[0]==n[1], p[1]==n[2]``

となります.Cで「 ``&p[i]==p+i`` 」と定めたのは「 ``p+=sizeof(int);`` 」の代わりに 「 ``p++;`` 」を使いたいためであると思われます.『アドレス+整数』と 『アドレス"アドレス』は次元(?)が違うので ``&n[1]-&n[0]==sizeof(int)`` と定めることもできますが [*]_ , ``&n[1]!=&n[0]+(&n[1]-&n[0])`` となるので, Cの言語仕様はそうなっていません.実際

::

 #include <stdio.h>
 int main(void)
 {
   int n[3], k0=&n[0], k1=&n[1];
   printf("%d, %d\n", k1-k0, &n[1]-&n[0]);
   return 0;
 }

を実行すると, ``k1-k0==sizeof(int), &n[1]-&n[0]==1,2*(&n[1]-&n[0])==2`` と なります.「 ``k0=&n[0];`` 」は警告が出るかもしれませんが,無意味な代入では ないのでエラーにはなりません.

.. [*] Cの表現における ``&n[1]==n+1 && &n[1][2]!=(n+1)+2`` 等の不自然な式が

      なくなります.どう定めても複雑な式には歪が伴います.

2次元配列とポインタの配列 =================================================

プログラム例を示す前に「 ``int n[2][2],*p[2],(*q)[][2];`` 」で宣言される ``n, p, q`` について説明します.Cの記法ではありませんが

::

 「int        n[2][2];」「int      *p[2];」「int        (*q)[][2];」
 『int[2]     n[2];   』『int*     p[2]; 』『int[2][]   *q;       』
 『int[2][2]  n;      』『int*[2]  p;    』『int[2][]*  q;        』 

と書き換えることにより, ``n`` は整数の2次元配列,p は整数へのポインタの 1次元配列,q は整数の2次元配列へのポインタであることが分かりやすく なります.なお,「 ``int m[2][3][4];`` 」と宣言されているとき,

 ``&m[i][j][k]-&m[0][0][0]==4*(3*i+j)+k``

であることは

::

 for(i=0; i<2; i++)for(j=0; j<3; j++)for(k=0; k<4; k++){
   printf("%d,", &m[i][j][k]-&m[0][0][0]);
 }

を実行することで確認できます.また ``&m[i][j][k]`` に対して

 ``m[i][j]+k==&m[i][j][k], m[i]==m[i][0], m==m[0]``

と定められています.ただし, ``k`` が ``0`` でないとき ``m[i][0]`` に ``m[i]`` を代入 できません. ``m[0]`` と ``m`` についても同様です.

例2. 次のプログラムの出力は「 ``5, 7`` 」.

::

 #include <stdio.h>
 int main(void)
 {
   int n[2][2]={{4, 5}, {6, 7}}, *p[2], (*q)[][2];
   q=p[1]=&n[0][1];
   printf("%d, %d\n", p[1][0], (*q)[1][0]);
   return 0;
 }

問2. 例2の ``n, p, q`` について

(1) ``***q`` の値を示せ. (2) 「 ``n[1]=p[1];`` 」がエラーとなる理由を述べよ.

以下では簡単のため「 ``A==B && B==C && C==D`` 」を『 ``A == B == C == D`` 』 のように略記します.例2のプログラムでは ``p[1]==&n[0][1]`` ですから,

 『 ``p[1][0] == *p[1] == *(&n[0][1]) == n[0][1] == 5`` 』

です. ``q`` の方は初期値 ``&n[0][1]`` を用いて

 ``(*q)[0][0]==*(&n[0][1]), (*q)[1][0]==*(&n[0][1]+2*1+0)``

と解釈され, ``**(*q) == n[0][1], (*q)[1][0] == n[1][1]`` となります. 『 ``q == *q == **q == &n[0][1]`` 』であることは分かり難いのですが, 「 ``(*q)[i][j]==q[0][i][j]`` 」であり「 ``int m[2][3][4];`` 」のときの

『 ``m == *m == **m == &m[0][0][0], ***m == m[0][0][0]`` 』

と類似の関係になっています.なお ``n[1]`` はアドレスであって(ポインタ とは異なり)メモリ上に領域が与えられていないので,値を代入することは できません.

::

   n 『n[0][0]=4;』『n[0][1]=5;』『n[1][0]=6;』『n[1][1]=7;』
   p 『p[0]      』『p[1]=(※);』
  &q 『q=p[1];   』
      (※)==&n[0][1], (*q)[0][0]==*p[1], (*q)[0][1]==*(p[1]+1)

文字列とポインタ =================================================

Cには string 型がないため,文字列は先頭をアドレス,末尾を制御文字 ``'\0'`` で表わします.例えば,宣言「 ``char s[]="ABC";`` 」は

 ``char s[4]={'A', 'B', 'C', '\0'};``

を略記したもので,先頭のアドレスが ``s`` で ``s[3]=='\0'`` になっています. 「 ``char *p="ABC";`` 」という宣言は少し分かりにくいのですが,適当な場所に ``"ABC"`` を格納する配列をつくり,その先頭アドレスを ``p`` に設定します. Cでは文字列の評価値は先頭アドレスなので,初期状態では ``p=="ABC", *p=='A'`` です.

例3. 次のプログラムの出力は「 ``B, DE`` 」.

::

 #include <stdio.h>
 int main(void)
 {
   char s[2][8]={"ABC", "DE"}, (*p)[8]=s;
   printf("%c, %s\n", p[0][1], p[1]);
   return 0;
 }

問3. 例3の ``s, p`` について

(1) ``(*p)[2]`` の値を示せ. (2) ``*(*p+1)`` の値を示せ.

「 ``char (*p)[8]=s;`` 」で ``p`` に設定されるのは ``s`` です. ``p`` は『 ``char[8]`` 』への ポインタなので ``p[i]==s[i], p[i][j]==s[i][j]`` が成立し, ``p[0][1]=='B',p[1]==s[1]`` です.また

 ``(*p)[2]==p[0][2], *p+1==p[0]+1, *(p[0]+1)==p[0][1]``

ですから, ``(*p)[2]=='C', *(*p+1)=='B'`` です.「 ``char (*q)[4]=s;`` 」と 宣言された ``q`` では ``q[1][0]==s[0][4], q[2][0]==s[1][0]`` です.

仮引数での宣言 =================================================

Cでは(値呼びしかできないため)関数の引数にポインタが多用されます. ポインタ ``p`` が配列と関係なければ単に ``*p`` と表わせばいいので,ここでは 直接あるいは間接に配列を指すポインタについて考えます.実引数としたい 配列と型を合わせたいときは

::

 int n1[4];        -->  (int p1[])        または (int *p1)
 int n2[4][5];     -->  (int p2[][5])
 int n3[4][5][6];  -->  (int p3[][5][6])
 int *m1[4];       -->  (int *q1[])       または (int **q1)
 int *m2[4][5];    -->  (int *q2[][5])

のように宣言します, ``p1, p2, p3, q1, q2`` がすべて配列ではなくポインタ であることは,関数内で ``sizeof(p1)`` 等を ``printf()`` で表示することによって 確認できます.

例4. 次のプログラムの出力は「 ``B, D`` 」.

::

 #include <stdio.h>
 void check(char p2[][8], char *q1[])
 {
   printf("%c, %c\n", p2[0][1], *q1[1]);
 }
 int main(void)
 {
   char s[2][8]={"ABC", "DE"}, *r[2];
   r[0]=s[0]; r[1]=s[1]; check(s, r);
   return 0;
 }

問4. 例4の ``p, q`` について

(1) ``**q1`` の値を示せ. (2) ``q1[1][2]`` の値を示せ.

仮引数の宣言の ``[]`` を ``[N]`` ( ``N`` は適当な定数)で置換した大域変数や局所 変数の宣言を考えると,配列要素のアドレスの計算に ``N`` は不要であることが 分かります.「 ``char s[2][8];`` 」のとき ``&s[i][j]-&s[0][0]==8*i+j`` ですが, 仮引数の宣言「 ``int p2[][8]`` 」でも同様に

 ``&p2[i][j]-&p2[0][0]==8*i+j``

です.したがって ``p2[0][1]==s[0][1]`` となります.また「 ``char *r[2];`` 」の ``r[i]`` は実在するポインタ,「 ``char *q1[]`` 」の ``q1[i]`` は計算したアドレス ですが,

 ``q1[i]==*(q1+i), q[i][j]==*(q1[i]+j)``

なので, ``q1==r`` であれば ``q1[i][j]==r[i][j]`` が成立します.このとき ``*q1[1]==r[1][0], **q1==r[0][0], q1[1][2]='\0'`` です.宣言として 「 ``char *q1[]`` 」の代わりに「 ``char **q1`` 」を用いても同じですが,局所変数に 対しては「 ``char **q;`` 」を「 ``char *q[];`` 」のように宣言することはできません.

なお,必ずしも実引数と仮引数の型を合わせるのがよいとは限りません. 一例を次に示します.

::

 #include <stdio.h>
 extern int sum, n[10][10][10];
 void add(int k, int *p)
 {
   while(k>0){sum+=*p; p++; k--;}
 }
 int main(void)
 {
   sum=0; add(1000, n); printf("sum=%d\n", sum);
   return 0;
 } 

構造体メンバの参照 =================================================

構造体のメンバ ``x.m`` は ``p==&x`` であるポインタを用いて ``p->m`` で参照でき ます.このことに詳しくない人は,まず構造体の基礎を学んでください.

例5. 次のプログラムの出力は「 ``ADC`` 」.

::

 typedef struct{char s[8], *p;} str2;
 void main_5(void)
 {
   str2 x[2]={{"ABC"}, {"DE"}}, *q=x+1;
   x[0].p=x[1].s; x[1].p=x[0].s; x[0].s[1]=q->s[0];
   printf("%s\n", x[0].s);
 } 

問5. 例5の ``x, p`` について

(1) ``q->s[1]`` の値を示せ. (2) ``q->p[1]`` の値を示せ.

「 ``x[1].p=x[0].s;`` 」実行後に ``x[0].s[i]`` を書き換えても ``x[1].p[i]`` も 変わるので, ``q->p[1]=='D'`` です.

補遺 =================================================

ポインタについて考えるときに留意すべき点は,ポインタが参照するデータ の構造はポインタの宣言のみで決まるということです.例えば

 ``int n[2][3], *p=&n[0][1];``

と宣言されていれば,『 ``(int*) p=&n[0][1];`` 』なので

 ``p[-1]==n[0][0], *p==n[0][1], p[1]==n[0][2]``

となります.つまり ``p`` から見れば ``p[i]`` は ``n`` に関係なく ``p+i`` にある データ ``*(p+i)`` に過ぎないのです.細かい補足は以下に列挙します.

1. ``printf()`` の書式の ``%p`` は処理系に依存しますが [*]_ ,エラーになる条件が ``%d`` や

  ``%u`` と変わるとは思えません.例えば ``&n[0]+&n[1]`` は ``%u`` でもエラーになります.
  数値を調べるだけであれば「 ``&n[1]-&n[0]`` は ``%p`` か ``%d`` か?」と思案する必要はないでしょう.

.. [*] 自分の処理系での数値だけに着目し,[3]のような難しい説明は気にしないことにしましょう.

2. 「 ``int n[][2]={4, 5, 6};`` 」は「 ``int n[2][2]={{4, 5}, {6, 0}};`` 」

  として扱われます.「 ``int p[];`` 」や「 ``int p[][2];`` 」をポインタの宣言に
  使えないのはのは,このことが関係しているものと思われます.配列要素を
  参照するときは ``(*p)[i][j]`` より ``p[0][i][j]`` の方が分かりやすいでしょう.
  参照先によっては ``p[k][i][j]`` も使えます.

3. 「 ``char *p;`` 」は「 ``char* p;`` 」と同じですが,「 ``char* p, q;`` 」は

  「 ``char *p, q;`` 」として処理されます.「 ``char* p;`` 」「 ``char* q;`` 」を
  まとめるには「 ``typedef char *cptr; cptr p, q;`` 」のようにします.

4. Cのバイブル[1]に複雑な宣言の例として「 ``char (*(*x[3])())[5];`` 」

  が挙げられていますが,これを::
   「char                (*(*x[3])())[5];」
   『char[5]             *(*x[3])();     』
   『char[5]*            (*x[3])();      』
   『()(char[5]*)        *x[3];          』
   『(()(char[5]*))*     x[3];           』
   『(()(char[5]*))*[3]  x;              』
  と変形すると, ``x`` が「 ``array [3] of pointer to function returning 
  pointer to array [5] of char`` 」であることが少し分かりやすくなるかも
  知れません(すぐれた教育用言語である Pascal での表現に近づきます).

5. 自分でプログラムを書くときは,なるべく素直な表現を使いましょう.

  ``scanf()`` で 変数 ``x[i][j]`` にデータを入力するとき, ``&x[i][j]`` の方が
  ``x[i]+j`` より素直です.ポインタの更新も独立した文で行いましょう.
  言語仕様からいえば「 ``printf("%p, %d\n", p++, *p);`` 」の結果は処理系
  に依存します.

あとがき =================================================

教科書・参考書を謙虚に学ぶことが基本ですが,疑問点を自力で解決しよう とする姿勢も重要です.このことを奨励するために,比較的取り組みやすい 例を示しました.

@@reference: B. W. カーニハン,D. M. リッチー著,石田晴久訳, プログラミング言語C 第2版, 共立出版, 1989, 149, 4320024834@@ @@reference: kmaebashi.com/programmer/pointer.html, 配列とポインタの完全制覇@@ @@reference: docs.sun.com/source/806-4836/conv_v9.html, LP64 データ型モデルへの変換@@

@@author: pulsar@@ @@accept: 2010-03-10@@ @@category: プログラミング@@ @@id: CPointerByMyself@@

Valid XHTML 1.1! home > コンピュータ >
リロード   新規 編集 凍結 差分 添付 複製 改名   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS
Modified by 物理のかぎプロジェクト PukiWiki 1.4.5_1 Copyright © 2001-2005 PukiWiki Developers Team. License is GPL.
Based on "PukiWiki" 1.3 by yu-jiPowered by PHP 5.2.17HTML convert time to 0.046 sec.