執筆中/自分で調べるＣのポインタ (pulsar著) のバックアップソース(No.19)

#rst2hooktail_source
============================================================
自分で調べるＣのポインタ
============================================================

Ｃ言語の開発環境があれば，自分でテストプログラムを作ることにより，
手持ちの教科書・参考書だけでポインタの性質を理解することができます．
以下に調べ方の例を示します．例を変更して自分でいろいろ試みてください．
本文に誤りがあったとき自信を持って訂正できます．



簡単な例
=================================================

まず次の例を考えましょう．結果が予想できない人は実際にプログラムを
作って実行してください．


例１. 次のプログラムの出力は「1, 4」．

::

  #include <stdio.h>
  int main(void)
  {
    int n[3]={4, 5, 6}, *p=n;
    printf("%d, %d\n", p==&n[0], *p);
    return 0;
  }

問１. 例１の n, p について

(1) ``p[1]`` の値を示せ.
(2) ``&n[1]-&n[0]`` の値を示せ.


例１で実在する変数は ``n[0], n[1], n[2], p`` のみですが，「 ``p=n;`` 」によって
``n[i]`` の代わりに ``p[i]`` を使うことができます．一般に

  ``p[i]==*(p+i), &p[i]==p+i``

したがって ``p==&p[0]，*p==p[0]`` であり，「 ``p=n+1;`` 」とすると

  ``p[-1]==n[0], p[0]==n[1], p[1]==n[2]``

となります．Ｃで「 ``&p[i]==p+i`` 」と定めたのは「 ``p+=sizeof(int);`` 」の代わりに
「 ``p++;`` 」を使いたいためであると思われます．『アドレス＋整数』と
『アドレス－アドレス』は次元（？）が違うので ``&n[1]-&n[0]==sizeof(int)`` 
と定めることもできますが [*]_ , ``&n[1]!=&n[0]+(&n[1]-&n[0])`` となるので，
Ｃの言語仕様はそうなっていません．実際

::

  #include <stdio.h>
  int main(void)
  {
    int n[3], k0=&n[0], k1=&n[1];
    printf("%d, %d\n", k1-k0, &n[1]-&n[0]);
    return 0;
  }

を実行すると, ``k1-k0==sizeof(int), &n[1]-&n[0]==1，2*(&n[1]-&n[0]==2`` と
なります．「 ``k0=&n[0];`` 」は警告が出るかもしれませんが，無意味な代入では
ないのでエラーにはなりません．

.. [*] Ｃの表現における ``&n[1]==n+1 && &n[1][2]!=(n+1)+2`` 等の不自然な式が
       なくなります．どう定めても複雑な式には歪が伴います．



２次元配列とポインタの配列
=================================================

プログラム例を示す前に「 ``int n[2][2]，*p[2]，(\*q)[][2];`` 」で宣言される 
``n, p, q`` について説明します．Ｃの記法ではありませんが

::

  「int        n[2][2];」「int      *p[2];」「int        (*q)[][2];」
  『int[2]     n[2];   』『int*     p[2]; 』『int[2][]   *q;       』
  『int[2][2]  n;      』『int*[2]  p;    』『int[2][]*  q;        』 

と書き換えることにより, ``n`` は整数の２次元配列，p は整数へのポインタの
１次元配列，q は整数の２次元配列へのポインタであることが分かりやすく
なります．なお，「 ``int m[2][3][4];`` 」と宣言されているとき，

  ``&m[i][j][k]-&m[0][0][0]==4*(3*i+j)+k``

であることは

::

  for(i=0; i<2; i++)for(j=0; j<3; j++)for(k=0; k<4; k++){
    printf("%d,", &m[i][j][k]-&m[0][0][0]);
  }

を実行することで確認できます．また ``&m[i][j][k]`` に対して

  ``m[i][j]+k==&m[i][j][k], m[i]==m[i][0], m==m[0]``

と定められています．ただし, ``k`` が ``0`` でないとき ``m[i][0]`` に ``m[i]`` を代入
できません. ``m[0]`` と ``m`` についても同様です．


例２. 次のプログラムの出力は「5, 7」．

::

  #include <stdio.h>
  int main(void)
  {
    int n[2][2]={{4, 5}, {6, 7}}, *p[2], (*q)[][2];
    q=p[1]=&n[0][1];
    printf("%d, %d\n", p[1][0], (*q)[1][0]);
    return 0;
  }

問２. 例２の ``n, p, q`` について

(1) ``***q`` の値を示せ．
(2) 「 ``n[1]=p[1];`` 」がエラーとなる理由を述べよ．


以下では簡単のため「 ``A==B && B==C && C==D`` 」を『 ``A == B == C == D`` 』
のように略記します．例２のプログラムでは ``p[1]==&n[0][1]`` ですから，

  『 ``p[1][0] == \*p[1] == \*(&n[0][1]) == n[0][1] == 5`` 』

です. ``q`` の方は初期値 ``&n[0][1]`` を用いて

  ``(\*q)[0][0]==*(&n[0][1]), (\*q)[1][0]==*(&n[0][1]+2*1+0)``

と解釈され, ``**(*q) == n[0][1], (*q)[1][0] == n[1][1]`` となります．
『 ``q == *q == **q == &n[0][1]`` 』であることは分かり難いのですが，
「 ``(*q)[i][j]==q[0][i][j]`` 」であり「 ``int m[2][3][4];`` 」のときの

 『 ``m == *m == **m == &m[0][0][0], ***m == m[0][0][0]`` 』

と類似の関係になっています．なお ``n[1]`` はアドレスであって（ポインタ
とは異なり）メモリ上に領域が与えられていないので，値を代入することは
できません．

::

    n 『n[0][0]=4;』『n[0][1]=5;』『n[1][0]=6;』『n[1][1]=7;』
    p 『p[0]      』『p[1]=(※);』
   &q 『q=p[1];   』
       (※)==&n[0][1], (*q)[0][0]==*p[1], (*q)[0][1]==*(p[1]+1)



文字列とポインタ
=================================================

Ｃには string 型がないため，文字列は先頭をアドレス，末尾を制御文字'\0'
で表わします．例えば，宣言「char s[]="ABC";」は

  char s[4]={'A', 'B', 'C', '\0'};

を略記したもので，先頭のアドレスが s で s[3]=='\0' になっています．
「char \*p="ABC";」という宣言は少し分かりにくいのですが，適当な場所に 
"ABC" を格納する配列をつくり，その先頭アドレスを p に設定します．
文法的には正しくありませんが『p==&"ABC", \*p=='A'』という感じです．


例３. 次のプログラムの出力は「B, DE」．

::

  #include <stdio.h>
  int main(void)
  {
    char s[2][8]={"ABC", "DE"}, (*p)[8]=s;
    printf("%c, %s\n", p[0][1], p[1]);
    return 0;
  }

問３. 例３の s, p について

(1) (\*p)[2] の値を示せ．
(2) \*(\*p+1) の値を示せ．


「char (\*p)[8]=s;」で p に設定されるのは s です．p は『char[8]』への
ポインタなので p[i]==s[i], p[i][j]==s[i][j] が成立し，p[0][1]=='B'，
p[1]==s[1] です．また

  (\*p)[2]==p[0][2], \*p+1==p[0]+1, \*(p[0]+1)==p[0][1]

ですから，(\*p)[2]=='C', \*(\*p+1)=='B' です．「char (\*q)[4]=s;」と
宣言された q では q[1][0]==s[0][4], q[2][0]==s[1][0] です．



仮引数での宣言
=================================================

Ｃでは（値呼びしかできないため）関数の引数にポインタが多用されます．
ポインタ p が配列と関係なければ単に \*p と表わせばいいので，ここでは
直接あるいは間接に配列を指すポインタについて考えます．実引数としたい
配列と型を合わせたいときは

::

  int n1[4];        -->  (int p1[])        または (int *p1)
  int n2[4][5];     -->  (int p2[][5])
  int n3[4][5][6];  -->  (int p3[][5][6])
  int *m1[4];       -->  (int *q1[])       または (int **q1)
  int *m2[4][5];    -->  (int *q2[][5])

のように宣言します．p1, p2, p3, q1, q2 がすべて配列ではなくポインタ
であることは，関数内で sizeof(p1) 等を printf() で表示することによって
確認できます．


例４. 次のプログラムの出力は「B, D」．

::

  #include <stdio.h>
  void check(char p2[][8], char *q1[])
  {
    printf("%c, %c\n", p2[0][1], *q1[1]);
  }

  int main(void)
  {
    char s[2][8]={"ABC", "DE"}, *r[2];
    r[0]=s[0]; r[1]=s[1]; check(s, r);
    return 0;
  }

問４. 例４の p, q について

(1) \*\*q1 の値を示せ．
(2) q1[1][2] の値を示せ．


仮引数の宣言の [] を [N]（N は適当な定数）で置換した大域変数や局所
変数の宣言を考えると，配列要素のアドレスの計算に N は不要であることが
分かります．「char s[2][8];」のとき &s[i][j]-s[0][0]==8*i+j ですが，
仮引数の宣言「int p2[][8]」でも同様に

  &p2[i][j]-&p2[0][0]==8*i+j

です．したがって p2[0][1]==s[0][1] となります．また「char \*r[2];」の 
r[i] は実在するポインタ，「char \*q1[]」の q1[i] は計算したアドレス
ですが，

  q1[i]==*(q1+i), q[i][j]==*(q1[i]+j)

なので，q1==r であれば q1[i][j]==r[i][j] が成立します．このとき 
\*q1[1]==r[1][0], \*\*q1==r[0][0], q1[1][2]='\0' です．宣言として
「char \*q1[]」の代わりに「char \*\*q1」を用いても同じですが，局所変数に
対しては「char \*\*q;」を「char \*q[];」のように宣言することはできません．

なお，必ずしも実引数と仮引数の型を合わせるのがよいとは限りません．
一例を次に示します．

::

  #include <stdio.h>
  extern int sum, n[10][10][10];
  void add(int k, int *p)
  {
    while(k>0){sum+=*p; p++; k--;}
  }

  int main(void)
  {
    sum=0; add(1000, n); printf("sum=%d\n", sum);
    return 0;
  } 



構造体メンバの参照
=================================================

構造体のメンバ x.m は p==&x であるポインタを用いて p->m で参照でき
ます．このことに詳しくない人は，まず構造体の基礎を学んでください．


例５. 次のプログラムの出力は「ADC」．

::

  typedef struct{char s[8], *p;} str2;
  void main_5(void)
  {
    str2 x[2]={{"ABC"}, {"DE"}}, *q=x+1;
    x[0].p=x[1].s; x[1].p=x[0].s; x[0].s[1]=q->s[0];
    printf("x[0].s=%s\n", x[0].s);
  } 

問５. 例５の x, p について

(1) q->s[1] の値を示せ．
(2) q->p[1] の値を示せ．


「x[1].p=x[0].s;」実行後に x[0].s[i] を書き換えても x[1].p[i] も
変わるので，q->p[1]=='D' です．



補遺
=================================================

ポインタについて考えるときに留意すべき点は，ポインタが参照するデータ
の構造はポインタの宣言のみで決まるということです．例えば

  int n[2][3], \*p=&n[0][1];

と宣言されていれば，『(int*) p=&n[0][1];』なので

  p[-1]==n[0][0], \*p==n[0][1], p[1]==n[0][2]

となります．つまり p から見れば p[i] は n に関係なく p+i にある
データ \*(p+i) に過ぎないのです．細かい補足は以下に列挙します．

1. 「int n[][2]={4, 5, 6};」は「int n[2][2]={{4, 5}, {6, 0}};」
として扱われます．「int p[];」や「int p[][2];」をポインタの宣言に
使えないのはのは，このことが関係しているものと思われます．配列要素
を参照するときは「(\*p)[i][j]」より「p[0][i][j]」の方が分かりやすい
でしょう．参照先によっては「p[k][i][j]」も使えます．

2. 「char \*p;」は「char* p;」と同じですが，「char* p, q;」は
「char \*p, q;」として処理されます．「char* p;」「char* q;」を
まとめるには「typedef char \*cptr; cptr p, q;」のようにします．

3. Ｃのバイブル[1]に複雑な宣言の例として「char (\*(\*x[3])())[5];」
が挙げられていますが，これを

::

    「char                (*(*x[3])())[5];」
    『char[5]             *(*x[3])();     』
    『char[5]*            (*x[3])();      』
    『()(char[5]*)        *x[3];          』
    『(()(char[5]*))*     x[3];           』
    『(()(char[5]*))*[3]  x;              』

と変形すると，x が「array [3] of pointer to function returning 
pointer to array [5] of char」であることが少し分かりやすくなるかも
知れません（すぐれた教育用言語である Pascal での表現に近づきます）．

4. 自分でプログラムを書くときは，なるべく素直な表現を使いましょう．
scanf() で 変数 x[i][j] にデータを入力するとき，&x[i][j] の方が 
x[i]+j より素直です．ポインタの更新も独立した文で行いましょう．
言語仕様からいえば「printf("%d, %d\n", i++, n[i]);」の結果は処理系
に依存します．



あとがき
=================================================

教科書・参考書を謙虚に学ぶことが基本ですが，疑問点を自力で解決しよう
とする姿勢も重要です．このことを奨励するために，比較的取り組みやすい
例を示しました．


@@reference: B. W. カーニハン，D. M. リッチー著，石田晴久訳, プログラミング言語Ｃ 第２版, 共立出版, 1989, 149, 4320024834@@
@@reference: hooktail.org/wiki/index.php?%B4%D6%B0%E3%A4%A4%CA%F3%B9%F0, ほとんど文献調査を行っていません．引用すべき資料をご教示頂ければ幸いです．@@

@@author: pulsar@@
@@accept: 執筆中@@
@@category: プログラミング@@
物理のかぎプロジェクト