数値演算法 (11) 素因数分解

以前紹介した「RSA 暗号」は、大きな素数どうしの積を実用的な時間内に素因数分解することが非常に困難であることを利用した手法でした。しかし、素因数分解を効率よく行うためのアルゴリズムは存在し、かなり大きな数でも素因数分解は可能なので、鍵に使う数をさらに大きくすることで対処するというのが現状です。新たな手法が見つかれば、さらに数を大きくしたり、場合によっては RSA 暗号自体が利用できなくなる可能性もありますが、今のところはそのような手法は見つかっていないようです。今回は、素因数分解の手法について紹介したいと思います。

1) フェルマーのアルゴリズム

素因数分解の最も単純な方法は、与えられた数が割り切れるかを 2 から順番に試すやり方です。与えられた数を N としたとき、√N を超えない最大の整数まで割ってみて、割り切れる数がなければそれは素数であることになります。この手法は素数判定法としても利用することが可能で、「数値演算法 (6) 素数判定法」の「1) エラトステネスのふるい」の中でも紹介しています。

この方法は、小さな素因数から構成された数であれば有効ですが、そうでない場合は非常に時間がかかります。もし、N の素因数が √N に近い数であることがあらかじめわかっているのなら、次に紹介するフェルマーのアルゴリズムが有効な手法となります。フェルマーとは、「フェルマーの最終定理」で有名な「ピエール・ド・フェルマー ( Pierre de Fermat )」のことです。

与えられた数 N は奇数であると仮定します ( 偶数なら奇数になるまで 2 で割り続けて奇数の因数を得ます )。N = a x b ( 但し a ≥ b ) の形で因数の積に分解できるとしたとき、a, b も奇数となり、

となり、N は必ず平方数の差で表すことができます。N = ( x + y )( x - y ) なので、平方数の差で表すことができれば、因数 x + y, x - y に分解することができます。

x, y を見つけるために、以下のようなアルゴリズムを使用します。

x を 1 増やしたとき、x² から ( x + 1 )² への増分は 2x + 1 になります。y についても同様なので、上記アルゴリズムは次のようにすることができます。

このようにすると、ループの中で乗算がなくなり、より高速に処理ができるようになります。

フェルマーのアルゴリズムのサンプル・プログラムを以下に示します。

/*
  SquareRoot : t の平方根を求める

  ニュートン法を利用した平方根算出ルーチン
  t は符号なし整数であることを前提とし、√t を超えない最大数を返す
*/
template< class T >
T SquareRoot( T t )
{
  T a = t;
  T b = ( t + 1 ) / 2;

  while ( b < a ) {
    a = b;
    b = ( a * a + t ) / ( 2 * a );
  }

  return( a );
}

/*
  Factorization_fermat : フェルマーのアルゴリズムを使い素因数分解を行う

  すでに試し割りによって小さな素因数を持たない( 0 や 1、偶数でない )ことを想定していることに注意

  n 素因数分解を行う対象の数
  a, b 素因数分解を行った結果を返す変数へのポインタ
*/
template< class T >
void Factorization_fermat( T n, T* a, T* b )
{
  // √t 以上の最小数を求める
  T x = SquareRoot( n );
  if ( n > x * x )
    ++x;

  T x2 = x * x;
  T s = x * 2 + 1;
  T t;

  for ( ; ; ) {
    t = 3;
    T m = x2 - 1;
    while ( m > n ) {
      m -= t;
      t += 2;
    }
    if ( m == n ) break;
    x2 += s;
    s += 2;
  }

  *a = ( s + t - 2 ) / 2;
  *b = ( s - t ) / 2;
}

SquareRoot は平方根を算出するための関数です。算出には「ニュートン-ラフソン法 ( Newton-Raphson method )」を利用しています。Factorization_fermat がメイン・ルーチンで、前述のアルゴリズムをそのまま適用しています。なお、あらかじめ試し割りで小さな素因数を持たないこと、特に 0 や 1、偶数でないことを想定していることに注意して下さい。n = 1, 2, 4 のときは無限ループになります。

フェルマーのアルゴリズムは、素数 p に対しては [ ( p + 1 ) / 2 ]² - [ ( p - 1 ) / 2 ]² = p・1 となります。これが最大処理回数となるので、あらかじめ素数判定を行ってから実行する必要があります。また、小さな素因数からなる数に対しては試し割りによる方法よりも遅くなる場合もあります。例えば、176891 = 1237 x 143 の素因数分解には 0.1 秒以内で完了しているの対し、176893 = 7691 x 23 を素因数分解するのに約 1 秒かかっています。処理の内容からも明らかなように、大きな素因数からなる数に対して有効な方法ということになります。

2) ポラードの ρ 法 ( Pollard's Rho Algorithm )

「ポラードの ρ 法 ( Pollard's Rho Algorithm )」は、イギリスの数学者「ジョン・ポラード ( John Pollard )」によって 1975 年に考案された手法です。

N を素因数分解する対象の数、d を N が持つ未知の因数と仮定します。f(x) を多項式 ( 例えば x² + 1 ) として、初期値 x₀ から始めて以下の漸化式を使って数列を計算します。

上式は「合同式 ( Modular arithmetic )」と呼ばれ、x_i - f( x_i-1 ) が N で割り切れることを意味します。例えば、N = 247, x₀ = 2, f(x) = x² + 1 とすると、数列は以下のようになります。

例えば、247 の素因数として d = 13 を使うと、数列は次のようになります。

x_i ≡ f( x_i-1 ) ( mod N ) のとき、y_i ≡ f( y_i-1 ) ( mod d ) が成り立ちます ( 補足 1 )。d の剰余は有限個しかないので、いずれ値が等しくなる二数 y_i, y_j ( i ≠ j ) が現れます。漸化式 y_i ≡ f( y_i-1 ) ( mod d ) が成り立つことから、一度等しいニ数が現れるとそれ以降は循環し、任意の正数 t に対して y_i+t = y_j+t が成り立ちます。よって、そのような等しいニ数 y_i, y_j が見つかれば、

となって x_i ≡ x_j ( mod d ) が成り立ちます。つまり、d が x_i - x_j を割り切ることになり、x_i - x_j と N との最大公約数に少なくとも d は必ず含まれることになります。最大公約数は「ユークリッドの互除法」を使えば簡単に求められるので、これで素因数分解ができたことになります。

ところが、d の値は本来求めたい値なので今はわかりません。従って、y_i の値もわからず、いつ等しいニ数 y_i, y_j が現れるかも不明な状態です。そこで、i と j をいろいろと変えながら x_i - x_j と N との最大公約数を計算し、1 と N 以外の値が見つかるまでその処理を繰り返していきます。i と j を選ぶ方法はいろいろとありますが、1980 年に「リチャード・ブレント ( Richard Brent )」によって考案された方法が単純かつ高速に処理を行えます。

ポラードの ρ 法のサンプル・プログラムを以下に示します。

/*
  ユークリッドの互除法を使った最大公約数の計算

  a, b : 最大公約数を求める二つの自然数

  戻り値 : 最大公約数
*/
template< class T >
T gcd( T a, T b )
{
  if ( a < b ) std::swap( a, b );

  do {
    T r = a % b;
    a = b;
    b = r;
  } while ( b != 0 );

  return( a );
}

/*
  ポラードの ρ 法を使い素因数分解を行う

  n 素因数分解を行う対象の数
  a,b 素因数分解を行った結果を返す変数へのポインタ
  p 多項式計算関数へのポインタ
  x0 初期値
  maxCnt 最大試行回数
  戻り値 : 素因数分解に成功したら true を返す
*/
template< class T >
bool Factorization_pollardsRho( T n, T* a, T* b, T (*p)( T ), T x0, unsigned int maxCnt )
{
  // xi = x1 で初期化
  T xi = (*p)( x0 ) % n;
  // xj = x2 で初期化(内部ループで先行して更新するため x3 ではないことに注意)
  T xj = (*p)( xi ) % n;

  // 内部ループのカウント
  unsigned int count = 1;
  // xj の更新回数
  unsigned int inc = 3;
  for ( unsigned int cnt = 0 ; cnt < maxCnt ; cnt += count / 2 ) {
    for ( unsigned int i = 0 ; i < count ; ++i ) {
      xj = (*p)( xj ) % n;
      T diff = ( xi > xj ) ? xi - xj : xj - xi;
      T d = gcd( diff, n );
      if ( d != 1 && d != n ) {
        *a = d;
        *b = n / d;
        return( true );
      }
    }
    xi = xj;
    for ( unsigned int i = 0 ; i < inc ; ++i )
      xj = (*p)( xj ) % n;
    count *= 2;
    inc += count;
  }

  return( false );
}

引数の中にある T (*p)( T ) は変数名が p の部分で「型 T をとる引数を一つ持ち、型 T を戻り値とする関数へのポインタ」を意味します。多項式として任意のものを利用できるようにするためにこのような形にしています。また x0 は数列 x_i の初期値、maxCnt は最大試行回数をそれぞれ表しています。多項式 x² + 1 を使った場合の例を以下に示します。

3) ポラードの p - 1 法 ( Pollard's p － 1 Algorithm )

次に紹介するアルゴリズムも「ジョン・ポラード ( John Pollard )」によって 1974 年に考案されました。この手法には「フェルマーの小定理」が利用されています。

素因数分解したい数 N の素因数の一つを p とします。p - 1 の素因数が小さく、ある数 k に対して k! が p - 1 で割り切れると仮定すると、N を法とする数 c の k! 乗

は、フェルマーの小定理から法を p として 1 に合同になります。なぜなら、整数 a, a' を使い

と表せることから m は法 p に対しても c^k! に合同であり、整数 b を使って

となるからです。従って、p は m - 1 を割り切ることになり、N が m - 1 を割りきらなければ N と m - 1 の最大公約数が N の 1, N 以外の約数になる可能性があります。

残念ながら、p は未知数です。従って、c や k の数をいろいろ変えながら試してみるような方法をとります。幸い、c^k! = (...(((c¹)²)³)⁴...)^k なので、c からスタートしてべき数を 1 ずつ増やしながらべき乗を計算していけば非常に早く m を求めることができます ( *3-1 )。

ポラードの p - 1 法のサンプル・プログラムを以下に示します。

/*
  ModularPower : 繰り返し自乗法を使った法 n のべき乗計算( a の k 乗を n で割った余りを求める )

  テンプレート引数の I は、乗法・剰余・ビットシフト・AND・比較演算子が使える型である必要がある。
  剰余演算子やビットシフトなどを使うため、整数型であることを前提としている。

  底 a や法 n が 0 の場合は 0 を返す。
  指数が 0 の場合は法 n における 1 を返す。

  a 底
  k 指数
  n 法
  戻り値 : べき乗
*/
template< class I >
  I ModularPower( const I& a, I k, const I& n )
{
  if ( a == I() || n == I() ) return( I() ); // 底や法が 0 の場合は 0 を返す
  if ( k == I() ) return( 1 % n );           // 指数が 0 の場合は法 n における 1

  I mod( a % n ); // n を法とした a
  I ans( ( ( k & 1 ) > I() ) ? mod : 1 ); // 求める値

  for ( k >>= 1 ; k > I() ; k >>= 1 ) {
    mod = ( mod * mod ) % n;
    if ( ( k & 1 ) > I() )
      ans = ( ans * mod ) % n;
  }

  return( ans );
}

/*
  Factorization_pollardsP_1 : ポラードの p-1 法を使い素因数分解を行う

  n 素因数分解を行う対象の数
  a,b 素因数分解を行った結果を返す変数へのポインタ
  c 底
  maxCnt 最大処理回数(指数の最大値 + 1)
  戻り値 : 素因数分解に成功したら true を返す
*/
template< class T >
  bool Factorization_pollardsP_1( T n, T* a, T* b, T c, unsigned long int maxE )
{
  T m( c );
  for ( unsigned long int cnt = 0 ; cnt < maxE ; ++cnt ) {
    m = ModularPower( m, T( cnt + 1 ), n );
    T g = gcd( m - 1, n );
    if ( g == 1 ) continue;
    if ( g == n ) return( false );
    *a = g;
    *b = n / g;
    return( true );
  }

  return( false );
}

処理の内容は非常にシンプルで、関数 ModularPower を使って n を法とする m のべき乗を繰り返し計算しながら m - 1 と n との最大公約数を求めることを繰り返し、1, n 以外の約数が見つかったら素因数分解できたことになります。もし最大公約数が n になったら、m - 1 は n で割り切れることになるので m ≡ 1 ( mod n ) となり、m をこれ以上べき乗しても 1 に合同であるままとなります。従って、そうなった段階で処理を終了します。

4) リュカ数列 ( Lucas Sequence )

整数 P, Q を係数とする二次方程式 x² + Px + Q = 0 の二つの解を α, β としたとき、これらは

で表される数列 { U_n }, { V_n } を「リュカ数列 ( Lucas Sequence )」といいます。二つの数列から

D = P² - 4Q より Q = ( P² - D ) / 4 なので、Q が整数ならば P² - D は 4 で割り切れなければなりません。すなわち P² ≡ D ( mod 4 ) なので D は法 4 の平方剰余であり、「ルジャンドル記号 ( Legendre Symbol )」を用いて ( D / 4 ) = 1 と表されます ( *4-1 )。よって、D ≡ 0 または 1 ( mod 4 ) が成り立ち、D ≡ 0 ( mod 4 ) のとき P ≡ 0 または 2 ( mod 4 )、D ≡ 1 ( mod 4 ) のとき P ≡ 1 または 3 ( mod 4 ) となります。

リュカ数列については様々な漸化式が成り立ちます。まず、

という漸化式が得られます。また、同じ式に異なる変形を行うと

となります。P = 1, Q = -1 のとき、U_n+1 = U_n + U_n-1 でこれは「フィボナッチ数列 ( Fibonacci Numbers )」です。また、この結果から、{ U_n }, { V_n } は ( P, Q は整数なので ) 全て整数になることがわかります。

(4.4) 式より U_2n = V_nU_n なので U_n は U_2n を割り切ります。ある整数 k について、U_n が U_kn を割り切ると仮定すると、(4.3.2)式より

なので、帰納法より U_n は 2U_(k+1)n を割り切ります。また、(4.4) 式は V_n が U_2n を割り切ることも示しています。V_n が V_kn を割り切ると仮定すると、(4.3.1) と (4.4) より

となって、帰納法より V_n は 2V_(2k+1)n を割り切ります。このことから、次の定理が導かれます。

例として、フィボナッチ数列は U₁ = 1 から始まって次のようになります

表 4-1. フィボナッチ数列 ( P = 1, Q = -1 )
U₁	U₂	U₃	U₄	U₅	U₆	U₇	U₈	U₉	U₁₀	U₁₁	U₁₂
1	1	2	3	5	8	13	21	34	55	89	144

U₄ = 3 は 3 で割り切れますが、同様に U₈ = 21, U₁₂ = 144 も 3 で割り切れます。また、U₅ = 5 は 5 で割り切れ、U₁₀ = 55 も 5 で割り切れます。同じ初期値 ( P = 1, Q = -1 ) で V_n の方を見ると次のようになります。

表 4-2. リュカ数列 V_n ( P = 1, Q = -1 )
V₁	V₂	V₃	V₄	V₅	V₆	V₇	V₈	V₉	V₁₀	V₁₁	V₁₂
1	3	4	7	11	18	29	47	76	123	199	322

V₄ = 7 は 7 で割り切れるのに対し、V₈ = 47 は 7 では割り切れません。しかし、V₁₂ = 322 は 7 で割り切れます。

となります。n を素数 p としたとき、_pC_k = p! / k!( p - k )! は、p > k ならば k は p を割り切らないので、必ず p で割り切れることになります。また、2^1-p は p を法として 1 に合同なので ( 補足 2 )、

となります。なお、P^p ≡ P ( mod p ) は「フェルマーの小定理」P^p-1 ≡ 1 ( mod p ) から導かれます。

この結果は、V_p を p で割った余りが必ず P であり、U_p を p で割った余りが 0, 1, -1 のいずれかになることを示しています。これは、先ほど示した P = 1, Q = -1 の場合の U_n, V_n でも成り立っていることが容易にわかります。

が成り立ちます。p が D を割り切るならば、( D / p ) = 0 なので U_p ≡ 0 ( mod p ) となり、p は U_p を割り切ります。( D / p ) = -1 のとき、2U_p+1 ≡ 0 ( mod p ) より ( p が奇素数なら ) p は U_p+1 を割り切り、( D / p ) = 1 のとき、2QU_p-1 ≡ 0 ( mod p ) より ( p と 2Q が互いに素なら ) p は U_p-1 を割り切ります。

また、( D / p ) = -1 のとき、p が奇素数なら次が成り立ちます。

が成り立ちます。これらをまとめると次のようになります。

最後に、リュカ数列を利用して二次合同式 x² ≡ n ( mod p ) の解 x を解くアルゴリズムを紹介します。但し、p は奇素数であるとします。当然、n は p を法とする平方剰余、すなわち ( n / p ) = 1 です。

Q = n とし、( D / p ) = ( ( P² - 4Q ) / p ) = -1 になるような P を選んでリュカ数列を生成します。このとき、(4.7) より

なので、先ほど示した定理から V_p+1 ≡ 2n ( mod p ) が成り立つことを利用して

となります。V_(p+1)/2 が奇数であった場合を考慮して、上式を以下のように表します。

すなわち、[ ( p + 1 ) / 2 ]・V_(p+1)/2 は二次合同式 x² ≡ n ( mod p ) の解 x となります。この結果を利用したアルゴリズムは、「デリック・ヘンリー・レーマー ( Derrick Henry Lehmer )」によって 1969 年に考案されました。

「レーマーのアルゴリズム」のサンプル・プログラムを以下に示します。

/*
  Diff : ( u1 - u2 ) % p を解く

  u1 < u2 の場合、( u1 + Np - u2 ) % p として負数にならないようにする
*/
template< class U >
  U Diff( U u1, U u2, U p )
{
  if ( u1 < u2 ) {
    u1 += ( ( u2 - u1 ) / p + 1 ) * p;
  }

  return( ( u1 - u2 ) % p );
}

/*
  LehmerAlgorithm : レーマーのアルゴリズムで V_n ( 実際には r の剰余 ) を求める

  漸化式に v_2i = v_i^2 - 2n^i, v_2i+1 = v_i * v_i+1 - h x n^i を使う。
  ステップ数が対数となるため高速に処理できる。

  p リュカ数列のパラメータ P ( ルジャンドル記号 ( p^2 - 4q / r ) = -1 となる数 )
  q リュカ数列のパラメータ Q ( r を法とする平方剰余とする )
  r 法
  n 処理回数
  戻り値 : 二次合同式 x^2 = q ( mod r ) の解 x
*/
template< class U >
  U LehmerAlgorithm( U p, U q, U r, U n )
{
  U m( q );                        // q のべき乗 q^i
  U v0( p );                       // v_i
  U v1( Diff( p * p, 2 * q, r ) ); // v_i+1

  // n をビット列で表す(最上位ビットを除いていることに注意)
  std::vector< bool > bit;
  while ( n > 1 ) {
    bit.push_back( ( n & 1 ) == 1 );
    n /= 2;
  }

  for ( std::vector< bool >::reverse_iterator i = bit.rbegin() ; i != bit.rend() ; ++i ) {
    U v( Diff( v0 * v1, p * m, r ) );   // v_2i+1 = v_i * v_i+1 - pq^i
    v0 = Diff( v0 * v0, 2 * m, r );     // v_2i = v_i^2 - 2q^i
    v1 = Diff( v1 * v1, 2 * q * m, r ); // v_2i+2 = v_i+1^2 - 2q^(i+1)
    m = ( m * m ) % r;
    if ( ! *i ) {
      // 偶数(2)回分なら v_2i, v_2i+1 を採用
      v1 = v;
    } else {
      // 奇数(3)回分なら v_2i+1, v_2i+2 を採用
      v0 = v;
      m = ( q * m ) % r;
    }
  }

  return( v0 );
}

/*
  QC_Solver : レーマーのアルゴリズムを使い二次合同式を解く

  q リュカ数列のパラメータ Q ( r を法とする平方剰余とする )
  r 法
  戻り値 : 二次合同式 x^2 = q ( mod r ) の解 x
*/
template< class U >
  U QC_Solver( U q, U r )
{
  // ルジャンドル記号 ( p^2 - 4q / r ) = -1 となる数
  U p = 2 * ( SquareRoot( q ) + 1 );
  for ( ; ; ++p )
    if ( Jacobi( p * p - U( 4 ) * q, r ) < 0 )
      break;

  U n( ( r + 1 ) / 2 );            // 処理回数

  U v0 = LehmerAlgorithm( p, q, r, n );

  v0 = ( v0 * ( r + 1 ) / 2 ) % r;
  if ( v0 >= ( r + 1 ) / 2 )
    v0 = r - v0;

  return( v0 );
}

LehmerAlgorithm は指定した添字 n のリュカ数列 V_n を求めるための関数です。但し、変数 r を法とする値を返します。V_n の計算は、(4.7) と (4.8) を使えば高速に計算することができます。V_2n, V_2n+1, V_2n+2 を漸化式を使って計算し、上位ビット側 ( 但し、最上位ビットを除きます ) から順に、ビットが立っていたら V_n = V_2n+1, V_n+1 = V_2n+2 とし、そうでなければ V_n = V_2n, V_n+1 = V_2n+1 とします。例えば ( p + 1 ) / 2 = 22 ( ビット列 10110 ) だった場合、V₁, V₂ からスタートして

表 4-3. V_n の更新される様子
ビット列	V_n	V_n+1
10	:	V₁ → V₂	V₂ → V₃
101	:	V₂ → V₅	V₃ → V₆
1011	:	V₅ → V₁₁	V₆ → V₁₂
10110	:	V₁₁ → V₂₂	V₁₂ → V₂₃

となります。ビット列が増えるごとに n の値は二倍され、ビットが立っている場合は 1 を加えることで、左側のビット列と V_n の添字が対応することが理解できると思います。

QC_Solver は、LehmerAlgorithm を利用して二次合同式 x² ≡ q ( mod r ) の解 x を求めるための関数です。最初にパラメータ P の値を決めるため、( ( P² - 4q ) / r ) = -1 となる P を探索します。なお、ルジャンドル記号 ( ヤコビ記号 ) の計算には「3) Solovay-Strassen 素数判定法」の節で紹介した関数 Jacobi を使っています。あとは求めるリュカ数列の添字 n に ( r + 1 ) / 2 を指定して LehmerAlgorithm を呼び出し V_n を求め、r を法として V_n x ( r + 1 ) / 2 を計算すれば解が得られます。なお、解 x に対して r - x も同様の解となります。なぜなら

となるからです。LehmerAlgorithm でどちらが得られるかはわからないので、( r + 1 ) / 2 より大きい値が得られた場合は r - V_n を計算してより小さい側を返すようにしています。

5) ウィリアムズの p + 1 法 ( Williams's p + 1 Algorithm )

リュカ数列の特徴として、p が 2Q と互いに素な素数であるなら次の式が成り立つというものがありました。

Q = 1 で、p が ( D / p ) = -1 となるような素数であるとき、上式は次のようになります。

奇素数 p が U_n を割り切るとき、p は U_kn を割り切るのでした。よって、

も成り立ちます。それでは V_k(p+1) ≡ 2 ( mod p ) は成り立つのでしょうか。そこで、次のように式を変形していきます。

これを利用して、ポラードの p - 1 法に似た素因数分解の方法が得られます。素因数分解したい数 N の素因数の一つを p として、p + 1 の素因数が小さく、ある数 m に対して m! が p + 1 で割り切れると仮定します。Q = 1 とし、D = P² - 4 が ( D / p ) = -1 を満たすようなリュカ数列を V_n とします。p + 1 は m! を割り切るので、先ほどの結果から p は V_m! - 2 を割り切ります。従って、V_m! - 2 と N の最大公約数は N の素因数となる可能性があります。しかし、p は未知の数であり、( D / p ) = -1 であるかどうかもわかりません。従って、ポラードの p - 1 法と同じように、D の値を変えながら試行錯誤することになります。

ここで U_n の方を利用しなかった理由は処理速度の違いにあります。V_n に対しては V_2n, V_2n+1 を求める方法があるため、圧倒的に早く計算することができます。これは、ポラードの p - 1 法において c^k! の計算速度が非常に早いことと類似しています。

この手法は「ヒュー・ウィリアムズ ( Hugh Williams )」によって考案されたため「ウィリアムズの p + 1 法 ( Williams's p + 1 Algorithm )」といいます。

「ウィリアムズの p + 1 法」のサンプル・プログラムを以下に示します。

/*
  Factorization_WilliamsP_1 : ウィリアムズの p+1 法を使い素因数分解を行う

  n 素因数分解を行う対象の数
  a,b 素因数分解を行った結果を返す変数へのポインタ
  p リュカ数列のパラメータ P
  maxCnt 最大処理回数
  戻り値 : 素因数分解に成功したら true を返す
*/
template< class T >
  bool Factorization_WilliamsP_1( T n, T* a, T* b, T p, unsigned long int maxCnt )
{
  T v( p );
  for ( unsigned long int k = 1 ; k <= maxCnt ; ) {
    T g = gcd( v - 2, n );
    if ( g != 1 && g != n ) {
      *a = g;
      *b = n / g;
      return( true );
    }
    for ( unsigned long int i = 0 ; i < 10 ; ++i ) {
      v = LehmerAlgorithm( p, T( 1 ), n, T( k ) );
      p = v;
      ++k;
    }
  }

  return( false );
}

変数 v はリュカ数列 V_n を表し、最初は P で初期化しています。変数 k を 1 で初期化して、前節で紹介した関数 LehmerAlgorithm で V_k を計算します。求めた V_n は次のパラメータ P として処理を行っていますが、LehmerAlgorithm の中で V_n の初期値を P としていることから、k を 1 ずつ増やしながら計算を繰り返すことと同じこととなり、V_k! を求めていることになります。なお、V_k! - 2 と n の最大公約数は、k を 10 ずつ増やしながら行うようにしていますが、これは参考文献の処理内容をそのまま反映しています。

6) 二次ふるい法 ( Quadratic Sieve ; QS )

フェルマーのアルゴリズムは、x₂ - y₂ = N となるような x, y を探すことで素因数分解を行うというものでした。この条件を緩めて x² - y² ≡ 0 ( mod N ) とすると、ある整数 k について

となるので、x ± y は N の因数の一部で構成されている可能性があります。このとき、x ± y と N の最大公約数を求めることで因数が見つかるかもしれません。そこで、√N 以上の整数を x とし、x² - N を求めていき、その中で平方数を探すことを検討します。例えば、N = 33 のとき、√33 < 6 なので、

が見つかり、左辺は ( 7 + 4 )( 7 - 4 ) = 11・3 で素因数分解できたことになります。

ところが 137069 というような大きな数の場合、√137069 < 371 より

となって、簡単には平方数が見つからなくなります。素因数分解のために何度も素因数分解を行うのは効率が悪いため、あらかじめ小さな素数を決めておいて、それらで割り切れる数を探すことにします。すると、

となります。まだ平方数になる数は現れていませんが、よく見ると 377² - 137069, 381² - 137069, 382² - 137069 を掛け合わせたときの右辺は 2⁴ x 5² x 7² x 11² x 17² x 23² = ( 2² x 5 x 7 x 11 x 17 x 23 )² となって、平方数になります。従って、

となり、377・381・382 ± 2² x 5 x 7 x 11 x 17 x 23 = 55471474, 54267194 で、137069 との最大公約数を求めると 113 と 1213 が得られ、これらがそのまま素因数となります。

素因数分解したい数 N に対し、√N より大きな最小値を k として、r = k, k + 1, k + 2 ... に対して f(r) = r² - N を計算し、その中から小さな素数で素因数分解できる数を集めます。小さな素数が例えば 10 個だった場合、素因数分解できる数が 11 個集まれば、素数の数よりも式のほうが多くなるので必ず平方数にすることができるようになります ( これについては後述するガウスの消去法のところで説明します )。ここで問題となるのが、素因数分解できる数をすぐに集めることができるかという点です。素因数の大きさは数により様々ですが、素数でない限りは N より小さな値になります。N が 10^j より小さな数だとして、j 桁の数がどの程度の割合であるかを見積もると、その値は 10^j-1 から 10^j - 1 までの 10^j - 10^j-1 個あるので、ゼロを含めて全部で 10^j 個の数に対して

となります。少なくとも j - 1 桁の数は 99% であり、少なくとも j - 2 桁の数は 99.9% です。このことは、N の桁数が大きくなるほど最大素因数の桁数が小さな数の割合は少なくなっていくことを表しています。素因数の数を増やして最大素因数を大きくすれば割合は増えますが、その分割り切れる数をより多く集める必要があり、簡単にそうすることもできません。そこで、割り切れる数を探索するための"ふるい"を用意します。

まず、利用する素数は k 未満であるとします。k 未満の任意の素数 p は素因数分解対象の数 N を割り切らないことはすでにわかっているものとします。f(r) が p で割り切れるならば、

なので、ルジャンドル記号 ( N / p ) = 1 でなければならず、およそ半数の素数は除外できることになります。こうして得られた素数の集合を「因数基地 ( Factor Base )」といいます。

で、r は p を法として t か -t のいずれかに合同になります。

f(r) の値のリストに対して、p を法として t に合同な最初の r がわかれば、その r に対する f(r) は p で割り切れます。従って、その後の p 番目ごとの f(r) も同様に p で割り切れます。また、-t に合同な r がわかれば、同じ操作によって p で割り切れる f(r) を見つけることができます。ここで、実際に p での割り算を試す代わりに、ゼロで初期化した変数に p の対数を加算することにします。その値が最終的に f(r) の対数に近ければ、f(r) が素因数分解できる可能性のある r が見つかったことになります。

ここで、f(r) は同じ素数 p で何度も割り切れる可能性があるので、

となるような合同式も解く必要があります。しかし、高次のべきを持つ素数 p はたいてい小さな値になり、そのような値を何度も繰り返して加算するという効率の悪い処理となるため、高次のべきは無視して代わりに素因数分解可能だと判定する値を緩くすることにします。そもそも、p が大きい場合は高次のべきは少ないだろうと考えることもできます。

判定にパスした f(r) の候補は最終的に試し割り除算で本当に素因数分解できるかを確認します。候補数はかなり絞られるため、試し割りをする回数は最小限に抑えることができます。候補を絞り込む判定方法は正確ではないため、試し割りの結果、素因数分解できない数もあれば、逆に素因数分解できるのに見逃した数も含まれるかもしれませんが、処理の高速化の効果がそれを補って余ります。

先ほどの例 137069 を使って実際に二次ふるい処理を行ってみます。まず、素数 2 は特別扱いします。素因数するべき数 N は奇数なので、8 を法として 1, 3, 5, 7 のいずれかに合同です。r が奇数ならば、

と表すことができて、k( k + 1 ) は偶数なので 4k( k + 1 ) - 8m は 8 の倍数です。s = 3, 7 のとき、-s + 1 = -2, -6 なので、f(r) は 2 より大きい 2 のべき乗では割りきれません。s = 5 のとき、-s + 1 = -4 で、f(r) は 4 で割り切れますが、8 では割りきれません。s = 1 のとき、f(r) は少なくとも 8 で割り切れます。よって、N は 8 を法として 1 に合同であれば、少なくとも 8 を素因数とすることができます。そこで、N が 8 を法として 3 に合同であれば 3 を、5 に合同であれば 5 を、7 に合同であれば 7 を N に掛けることによって、1 に合同であるようにします。137069 は 8 を法として 5 に合同なので、5 を掛けて 685345 とします。

因数基地として、100 までの素因数を使います。2 を除く素因数は次のようになります。

この中で、( 685345 / p ) = 1 を満たす素数 p は次の 7 つしかありません。計算には「3) Solovay-Strassen 素数判定法」の節で紹介した関数 Jacobi を使いました。

次に、二次合同式 x² ≡ 685345 ( mod p ) となる解 x を求めます。これには「4) リュカ数列 ( Lucas Sequence )」の節で示したサンプル・プログラムの関数 QC_Solver が利用できます。ここで、解 x に対しては -x も解になることに注意して下さい。例えば、x² ≡ 685345 ( mod 3 ) について 1 が解になっていますが、同時に -1 ≡ 3 - 1 = 2 ( mod 3 ) も解となります。

√685345 = 827.9 なので、f(r) を計算してみる対象を 1000 個とした場合、r は 828 から 1827 となります。しかし、√685345 が中央値になるようにして 328 から1327 とすると、f(r) の値は小さな値になるので素因数分解できる見込みは高くなります。こうすることで負数が発生しますが、-1 を新たな因数として加えることで解決することができます。

素因数分解する数を N、ふるいにかける r の個数を M としたとき、i 番目の f(r) の値は、

程度になります。ふるい終わったときにこの値に近くなったものを選択して試し割りをすることになりますが、その最低値としては

という式が提案されています。T は 2 前後の定数で、p_max は因数基地の素因数の最大値を表します。

これで、ふるいを掛ける準備が整いました。まず最初に 8 について考えると、r の初期値は 828 で偶数なので、r² - N が偶数になるのは 829 からで、一つおきに log 8 を加算していきます。3 に対しては 828 ≡ 0 ( mod 3 ) なので、3 で割り切れるのは x² ≡ 685345 ( mod 3 ) の解 1 から 0 を引いた 1 番目の 829 からで、二つおきに log 3 を加えます。このとき、-1 ≡ 2 ( mod 3 ) も解であることに注意して、2 から 0 を引いた 2 番目の 830 からも二つおきに log 3 を加えます。
11 については 828 ≡ 3 ( mod 11 ) です。11 で割り切れるのは 1 から 3 を引いた -2 = 9 番目の 837 からで、10 個おきに log 11 を加えます。また、-1 ≡ 10 ( mod 11 ) も解なので、10 から 3 を引いた 7 番目の 835 からで、10 個おきに log 11 を加えます。これを繰り返していきます。

なので、それより値の大きな log f(r) を持つものから実際に素因数分解できる値を探索すると次のようになります。

表 6-1. 素因数分解の結果
r	log f(r)	素因数分解の結果
538	10.6917	89⁰ x 79⁰ x 59⁰ x 43¹ x 31¹ x 11¹ x 3³ x 2⁰ x (-1)¹
591	10.6456	89¹ x 79⁰ x 59¹ x 43⁰ x 31⁰ x 11⁰ x 3⁰ x 2⁶ x (-1)¹
593	9.9454	89⁰ x 79¹ x 59⁰ x 43⁰ x 31⁰ x 11¹ x 3¹ x 2⁷ x (-1)¹
623	6.93925	89⁰ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11⁰ x 3³ x 2⁸ x (-1)¹
671	10.9815	89⁰ x 79¹ x 59⁰ x 43⁰ x 31¹ x 11⁰ x 3¹ x 2⁵ x (-1)¹
709	11.0168	89⁰ x 79⁰ x 59¹ x 43¹ x 31⁰ x 11⁰ x 3² x 2³ x (-1)¹
751	7.5475	89⁰ x 79¹ x 59⁰ x 43⁰ x 31⁰ x 11⁰ x 3¹ x 2⁹ x (-1)¹
769	10.0646	89¹ x 79⁰ x 59⁰ x 43⁰ x 31⁰ x 11¹ x 3¹ x 2⁵ x (-1)¹
826	6.93049	89⁰ x 79⁰ x 59⁰ x 43⁰ x 31¹ x 11¹ x 3² x 2⁰ x (-1)¹
827	7.25559	89⁰ x 79⁰ x 59¹ x 43⁰ x 31⁰ x 11⁰ x 3¹ x 2³ x (-1)¹
829	7.5475	89⁰ x 79¹ x 59⁰ x 43⁰ x 31⁰ x 11⁰ x 3¹ x 2³ x (-1)⁰
833	7.66669	89¹ x 79⁰ x 59⁰ x 43⁰ x 31⁰ x 11⁰ x 3¹ x 2⁵ x (-1)⁰
839	6.93925	89⁰ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11⁰ x 3³ x 2⁴ x (-1)⁰
848	6.93049	89⁰ x 79⁰ x 59⁰ x 43⁰ x 31¹ x 11² x 3² x 2⁰ x (-1)⁰
857	9.00994	89⁰ x 79⁰ x 59⁰ x 43⁰ x 31¹ x 11¹ x 3² x 2⁴ x (-1)⁰
879	7.91132	89⁰ x 79⁰ x 59⁰ x 43⁰ x 31¹ x 11¹ x 3⁰ x 2⁸ x (-1)⁰
881	9.33715	89⁰ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11¹ x 3¹ x 2⁶ x (-1)⁰
943	7.25559	89⁰ x 79⁰ x 59¹ x 43⁰ x 31⁰ x 11⁰ x 3³ x 2⁷ x (-1)⁰
947	10.0646	89¹ x 79⁰ x 59⁰ x 43⁰ x 31⁰ x 11¹ x 3³ x 2³ x (-1)⁰
967	9.33715	89⁰ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11² x 3¹ x 2⁴ x (-1)⁰
1011	12.7272	89¹ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11¹ x 3⁰ x 2³ x (-1)⁰
1096	8.2938	89⁰ x 79⁰ x 59⁰ x 43² x 31¹ x 11⁰ x 3² x 2⁰ x (-1)⁰
1167	7.91132	89⁰ x 79⁰ x 59⁰ x 43⁰ x 31² x 11¹ x 3⁰ x 2⁶ x (-1)⁰
1189	13.4986	89¹ x 79⁰ x 59⁰ x 43⁰ x 31¹ x 11¹ x 3¹ x 2³ x (-1)⁰
1297	9.65349	89⁰ x 79⁰ x 59¹ x 43⁰ x 31⁰ x 11¹ x 3¹ x 2⁹ x (-1)⁰
1303	12.0361	89¹ x 79¹ x 59⁰ x 43⁰ x 31⁰ x 11⁰ x 3² x 2⁴ x (-1)⁰

次に、得られた素因数分解の結果を組み合わせて平方数となる数を生成する処理を「ガウスの消去法 ( Gaussian Elimination )」を使って行います。ガウスの消去法は連立方程式を解くためのアルゴリズムですが、これを応用することで機械的に平方数を得ることができます。

まず、左辺の係数部分に各素因数の指数を並べます ( 上位側ほど大きな素数に対する指数を表していることに注意して下さい。後述する処理方法からわかるように、出現頻度の少ないと思われる大きな素数の指数を上位に並べたほうが処理が高速化できます )。このとき、2 を法にして 0, 1 のいずれかで表します。また、右辺は単位行列を生成します。

係数行列の左端の値に着目して、1 になっている行を上側から探索します。上記の例では、r = 591 が対象の行となります。次に、同じく左端が 1 になっている行を探索し、両者を足し合わせます。このとき、値は 2 を法としているので、0 + 0 = 0, 0 + 1 = 1, 1 + 0 = 1, 1 + 1 = 0 となります。これは、ビットどうしの排他的論理和を表します。上記の例では r = 769 が対象で、以下のような計算結果になります。このとき、右辺は足し合わせた行の位置を表すことに注意して下さい。

表 6-2. 連立方程式 ( ガウスの消去法 )
r	係数行列	解行列
538	000111101	10000000000000000000000000
591	101000001	01000000000000000000000000
593	010001111	00100000000000000000000000
623	000100101	00010000000000000000000000
671	010010111	00001000000000000000000000
709	001100011	00000100000000000000000000
751	010000111	00000010000000000000000000
769	100001111	00000001000000000000000000
826	000011001	00000000100000000000000000
827	001000111	00000000010000000000000000
829	010000110	00000000001000000000000000
833	100000110	00000000000100000000000000
839	000100100	00000000000010000000000000
848	000010000	00000000000001000000000000
857	000011000	00000000000000100000000000
879	000011000	00000000000000010000000000
881	000101100	00000000000000001000000000
943	001000110	00000000000000000100000000
947	100001110	00000000000000000010000000
967	000100100	00000000000000000001000000
1011	100101010	00000000000000000000100000
1096	000010000	00000000000000000000010000
1167	000001000	00000000000000000000001000
1189	100011110	00000000000000000000000100
1297	001001110	00000000000000000000000010
1303	110000000	00000000000000000000000001

この操作を繰り返すと、一番上側の行以外は左端の値が全てゼロになります。操作が完了したら、足し合わせた一番上側の行は削除します。これは「ガウスの消去法」の「前進消去 ( Forward Elimination )」に似た処理ですが、係数は 0, 1 のいずれかであり除算をして 1 になるようにする必要はない分、通常の前進消去よりも高速に処理できます。左端の処理が全て完了したら、次は左から 2 番目という形で順番に処理を行うと、いずれ全ての係数がゼロになる行が現れます。これは、行どうしを掛け合わせたことで素因数の指数が全て偶数になり、平方数が完成したことを意味します。また、どの因数を掛け合わせたかは右辺の行を見ればわかります。上記の例では次の結果が見つかります。

x - y = 123509 で、685345 との最大公約数は 113 となります。これで 685345 = 113 x 6065 と素因数分解することができました。最初に 5 を掛けているので、6065 を 5 で割って、答えは 113 x 1213 になります。

係数の長さよりも式の数のほうが多ければ、係数が全てゼロになる行は必ず出現します。これは、前進消去によって一つの式でビット列の一列が全てゼロにできることから明らかです。しかし、式の数が係数の長さ以下だった場合は出現しない可能性のほうが高くなります。また、係数がゼロになる行が出現しても、x - y が 1 や素因数分解対象の数そのものになることもあるため、必ずしも成功するとは限りません。失敗した場合は、因数基地の数を増やすか、f(r) を計算する対象を増やして再度試してみることになります。

/*
  Pow : t の n 乗を計算する関数

  テンプレート引数の I は、乗法・除法・減算・剰余・等号演算子が使える型である必要がある。
  剰余演算子を使うため、整数型であることを前提としている。

  0 の 0 乗は 0 ではなく 1 を返す。
  また、べき数が負数の場合は assert を呼び出すので注意。

  t べき乗される数
  n べき数
*/
template< class I > I Pow( const I& t, const I& n )
{
  assert( n >= I() );

  if ( n == I() ) return( 1 );
  if ( n % 2 == I() ) {
    I t2 = Pow( t, n / 2 );
    return( t2 * t2 );
  } else {
    return( t * Pow( t, n - 1 ) );
  }
}

/*
  Log10 : 整数 n に対して 10 を底とする対数を求める
*/
template< class U >
double Log10( U n )
{
  double d0 = 0;
  double d1 = 0;
  while ( n > 0 ) {
    U r = n % 10;
    n /= 10;
    d0 += r[0];
    d0 /= 10;
    d1 += 1;
  }

  return( d1 + ( ( d0 == 0 ) ? 0 : std::log10( d0 ) ) );
}

/*
  Log : 整数 n に対して自然対数を求める
*/
template< class U >
double Log( U n )
{
  return( Log10( n ) / std::log10( std::exp( 1.0 ) ) );
}

/*
  FindPrime : max を最大数とする素数を因数基地 base に登録する

  但し、対象は ( n / p ) = 1 ( 平方剰余 ) となる素数 p に限定する
*/
void FindPrime( BigNum::Unsigned n, BigNum::Digit max, std::vector< BigNum::Digit >* base )
{
  Eratosthenes( max, base );

  for ( std::vector< BigNum::Digit >::size_type i = 0 ; i < base->size() ; ) {
    if ( Jacobi( n, BigNum::Unsigned( ( *base )[i] ) ) <= 0 )
      base->erase( base->begin() + i );
    else
      ++i;
  }
}

/*
  FindFactor : | r^2 - n | を因数基地 base で素因数分解する

  exp : 各素因数の指数を登録する配列へのポインタ
  coef : 各素因数の指数が奇数なら true とする二値を登録する配列へのポインタ

  exp と coef では登録する並び順が逆であることに注意

  戻り値 : 本登録を行ったら(因数基地の素因数で完全に割り切れたら) true を返す
*/
bool FindFactor( BigNum::Unsigned r, BigNum::Unsigned n, const std::vector< BigNum::Digit >& base, std::vector< std::vector< BigNum::Digit > >* exp, std::vector< std::vector< bool > >* coef )
{
  std::vector< BigNum::Digit > e( base.size() + 2, 0 );   // exp 用バッファ
  std::vector< bool > c( base.size() + 2, false ); // coef 用バッファ
  // exp と coef で登録する並び順は逆にする
  std::vector< BigNum::Digit >::iterator ei = e.begin();
  std::vector< bool >::reverse_iterator ci = c.rbegin();

  // fr = | r^2 - n | の計算
  // 同時に -1 の指数を登録する
  BigNum::Unsigned fr;
  if ( r * r < n ) {
    fr = n - r * r;
    *ei = 1;
    *ci = true;
  } else {
    fr = r * r - n;
  }
  ++ei; ++ci;

  // 2 の指数の登録
  while ( ( fr % 2 ) == 0 ) {
    ++( *ei );
    fr /= 2;
  }
  if ( ( *ei % 2 ) > 0 )
    *ci = true;
  ++ei; ++ci;

  // 3 以上の素因数の指数の登録
  for ( std::vector< BigNum::Digit >::const_iterator b = base.begin() ; b != base.end() ; ++b ) {
    while ( ( fr % ( *b ) ) == 0 ) {
      ++( *ei );
      fr /= *b;
    }
    if ( ( *ei % 2 ) > 0 )
      *ci = true;
    ++ei; ++ci;
  }

  // 完全に割り切れた場合だけ本登録を行う
  if ( fr == 1 ) {
    exp->push_back( e );
    coef->push_back( c );
    return( true );
  } else {
    return( false );
  }
}

/*
  SearchEvenRow : 指数が全て偶数となった(coefの要素が全てゼロの)行を探索する

  戻り値 : 指数が全て偶数となった行の番号 + 1 (ゼロなら見つからなかった)
*/
size_t SearchEvenRow( const std::vector< std::vector< bool > >& coef )
{
  size_t rows = coef.size();
  size_t cols = coef[0].size();

  for ( size_t r = 0 ; r < rows ; ++r ) {
    size_t c = 0;
    for ( ; c < cols ; ++c )
      if ( coef[r][c] ) break;
    if ( c >= cols ) return( r + 1 );
  }

  return( 0 );
}

/*
  GaussianElimination : 2 を法とする数値に対するガウスの消去法

  coef : 係数行列
  ans : 解行列

  戻り値 : 指数が全て偶数となった行の番号 + 1 (ゼロなら見つからなかった)
*/
size_t GaussianElimination( std::vector< std::vector< bool > >* coef, std::vector< std::vector< bool > >* ans )
{
  // 係数行列の行列数を取得する
  size_t rows = coef->size();
  if ( rows == 0 ) return( 0 );
  size_t cols = (*coef)[0].size();

  for ( size_t c = 0 ; c < cols ; ++c ) {
    // 左端から順に 1 を持つ最初の行を探索する
    size_t sr = 0;
    while ( ! (*coef)[sr][c] ) {
      ++sr;
      if ( sr >= rows )
        break;
    }

    // 見つかった行を、同じ列に 1 を持つ行に加算する
    for ( size_t r = sr + 1 ; r < rows ; ++r ) {
      if ( (*coef)[r][c] ) {
        for ( size_t i = 0 ; i < cols ; ++i )
          (*coef)[r][i] = (*coef)[r][i] ^ (*coef)[sr][i];
        for ( size_t i = 0 ; i < (*ans)[0].size() ; ++i )
          (*ans)[r][i] = (*ans)[r][i] ^ (*ans)[sr][i];
      }
    }

    // 加算した行は削除する
    if ( sr < rows ) {
      coef->erase( coef->begin() + sr );
      ans->erase( ans->begin() + sr );
      --rows;
      if ( rows == 0 ) return( 0 );
    }

    // 全てがゼロの要素からなる係数を持った行を探索する
    size_t evenRow = SearchEvenRow( *coef );
    if ( evenRow > 0 ) return( evenRow );
  }

  return( 0 );
}

/*
  FindFactorFromSquare : ガウスの消去法を使って完全平方を見つけ、素因数分解を試す

  coef : 連立方程式の係数行列
  ans : 連立方程式の解行列
  exp : 各因数基地の指数
  r : f(r) が因数基地で割り切れた平方完成の候補
  base : 因数基地
  n : 素因数分解する対象の数
  a, b : 分解した数を返す変数へのポインタ

  戻り値 : 素因数分解できたら true を返す
*/
bool FindFactorFromSquare
( std::vector< std::vector< bool > >* coef, std::vector< std::vector< bool > >* ans,
  const std::vector< std::vector< BigNum::Digit > >& exp, const std::vector< BigNum::Unsigned >& r, const std::vector< BigNum::Digit >& base,
  const BigNum::Unsigned& n, BigNum::Unsigned* a, BigNum::Unsigned* b )
{
  for ( ; ; ) {
    // ガウスの消去法
    size_t i = GaussianElimination( coef, ans );
    if ( i == 0 ) return( false );
    --i;

    // 平方数が見つかったら x, y を計算する
    std::vector< BigNum::Digit > expSum( base.size() + 1, 0 ); // 指数の和
    BigNum::Unsigned x( 1 );
    for ( std::vector< BigNum::Unsigned >::size_type k = 0 ; k < (*ans)[i].size() ; ++k ) {
      if ( ! (*ans)[i][k] ) continue;
      x *= r[k];
      x %= n;

      for ( std::vector< BigNum::Digit >::size_type j = 1 ; j < exp[k].size() ; ++j ) {
        expSum[j - 1] += exp[k][j];
      }
    }
    BigNum::Unsigned y( Pow( BigNum::Unsigned( 2 ), BigNum::Unsigned( expSum[0] / 2 ) ) );
    for ( std::vector< BigNum::Digit >::size_type k = 0 ; k < expSum.size() - 1 ; ++k ) {
      y *= Pow( BigNum::Unsigned( base[k] ), BigNum::Unsigned( expSum[k + 1] / 2 ) );
      y %= n;
    }

    // 一度平方数となった行は削除
    coef->erase( coef->begin() + i );
    ans->erase( ans->begin() + i );

    // x - y と n の最大公約数が真約数なら終了
    BigNum::Unsigned g = gcd( n, ( x > y ) ? x - y : y - x );
    if ( g != 1 && g != n ) {
      *a = g;
      *b = n / g;
      break;
    }
  }

  return( true );
}

/*
  QSieve : 二次篩 (QS) による n の素因数分解

  n : 素因数分解する対象の数
  a, b : 分解した数を返す変数へのポインタ
  baseMax : 因数基地(Factor Base)の最大素因数
  rMax : 探索を行う最大幅 ( n を中央値として √n - rMax / 2 から √n + rMax / 2 までを対象とする

  戻り値 : 素因数分解できたら true を返す
*/
bool QSieve( BigNum::Unsigned n, BigNum::Unsigned* a, BigNum::Unsigned* b, BigNum::Digit baseMax, BigNum::Digit rMax )
{
  // r^2 - n が 8 を因数として持つようにするため
  // n は法を 8 として 1 に合同になるようにする
  BigNum::Unsigned rem = n % 8;
  n *= rem;

  // r の最小値
  BigNum::Unsigned r0 = SquareRoot( n ) - rMax / 2 + 1;

  // 因数基地を求める
  std::vector< BigNum::Digit > base;
  FindPrime( n, baseMax, &base );
  if ( base[0] == 2 ) base.erase( base.begin() ); // 2 は除く

  // 因数基地を法とする n の平方根を求める
  std::vector< BigNum::Digit > sqrt( base.size() );
  for ( size_t i = 0 ; i < base.size() ; ++i ) {
    sqrt[i] = QC_Solver( n, BigNum::Unsigned( base[i] ) )[0];
  }

  // 因数基地の素数の対数を割り切れる対象に加算する
  std::vector< double > logSum( rMax, double() );
  for ( std::vector< double >::size_type i = ( ( r0 + 1 ) % 2 )[0] ; i < logSum.size() ; i += 2 )
    logSum[i] += std::log( 8 );
  for ( std::vector< BigNum::Digit >::size_type i = 0 ; i < sqrt.size() ; ++i ) {
    BigNum::Digit start = ( r0 % base[i] )[0];
    if ( start < sqrt[i] )
      start = sqrt[i] - start;
    else
      start = base[i] + sqrt[i] - start;
    for ( size_t u = start ; u < logSum.size() ; u += base[i] )
      logSum[u] += std::log( base[i] );

    start += base[i] - 2 * sqrt[i];
    for ( size_t u = start ; u < logSum.size() ; u += base[i] )
      logSum[u] += std::log( base[i] );
  }

  // ターゲット値の計算
  double target = Log( n ) / 2.0 + std::log( rMax ) - 1.5 * log( base.back() );

  // ガウスの消去法用の係数行列を求める
  std::vector< std::vector< BigNum::Digit > > exp;
  std::vector< std::vector< bool > > coef;
  std::vector< BigNum::Unsigned > r;
  for ( size_t i = 0 ; i < logSum.size() ; ++i ) {
    if ( logSum[i] <= target ) continue;
    if ( FindFactor( r0 + i, n, base, &exp, &coef ) ) {
      r.push_back( r0 + i );
    }
  }

  // 解行列は単位行列で初期化
  std::vector< std::vector< bool > > ans;
  for ( size_t i = 0 ; i < coef.size() ; ++i ) {
    ans.push_back( std::vector< bool >( coef.size(), false ) );
    ans.back()[i] = true;
  }

  // ガウスの消去法を使い、平方数となる組み合わせを探す
  while ( FindFactorFromSquare( &coef, &ans, exp, r, base, n, a, b ) ) {
    if ( *a % rem == 0 )
      *a /= rem;
    else
      *b /= rem;
    if ( *a != 1 && *b != 1 ) return( true ); // 割り算の後で 1 になっていないか再確認
  }

  return( false );
}

今まで紹介した素因数分解と比較するとかなり長いプログラムになっています。関数 QSieve がメインの関数で、素因数分解する対象の数 n を渡して結果をポインタ *a, *b に返します。また、baseMax を因数基地の最大素因数、rMax を f(r) を求める幅として渡します。計算には以前作成した「多倍長整数クラス ( BigNum::Unsigned )」を利用します。BigNum::Digit は多倍長整数の一桁分 ( 配列とみなしたときの要素の型 ) を表し、因数基地の最大素因数や f(r) を求める幅についてはこの型の大きさに制限されることに注意して下さい。

多倍長整数の対数を計算する必要があるため、関数 Log10 を用意しています。実装している内容は非常にシンプルで、

となることを利用して計算を行っています。また、Log10 を使えば、底の変換公式

関数 FindPrime は、因数基地を得るための関数で、max までの素数 p の中からルジャンドル記号 ( n / p ) = 1 ( 平方剰余 ) となるものを配列 base に登録します。素数の探索には「エラトステネスのふるい」を利用しています。

因数基地を求めたら、その中の各素数 p に対して x² ≡ n ( mod p ) の解 x を求めます。これには「リュカ数列」のサンプル・プログラム QC_Solver を利用します。あとは前述の通り、因数基地の素数の対数を加算し、判定値 target を超えたものに対して関数 FindFactor を使って素因数分解を試みます。素因数分解に成功したものだけを係数行列として登録し、ガウスの消去法 GaussianElimination を使って完全平方を見つけ、素因数分解できるかを試します。

7) 性能評価

フェルマーのアルゴリズムを除く各素因数分解アルゴリズムについて、処理速度を計測した結果を以下に示します。計測は、ランダムに作成した素数を二つ掛け合わせた値を 10 個作成して行い、その処理時間 ( 秒 ) の平均値を求めています。表の N は素因数分解したときの素数の桁数を表します。従って、N = 3 のときに得られる合成数は、100 x 100 = 10000 ( 5 桁 ) から 999 x 999 < 1000000 ( 6 桁 ) の間となります。

ポラードの ρ 法において、多項式には x² + 1 を使い、初期値を 2 としました。ポラードの p - 1 法の底は 2 としています。ウィリアムズの p + 1 法において、リュカ数列のパラメータ P は 7 とし、二次ふるい法においては因数基地の素因数の最大値を 400、f(r) の幅を 10000 としました。

二次ふるい法以外は、桁数の増大に従って処理時間も急激に増大します。二次ふるい法は桁数よりも因数基地の大きさや f(r) の幅に依存して処理速度が増大します。

残念ながら、二次ふるい法でも素因数分解に成功した最大桁数は素因数が 12 桁のところまでで、約 10 秒かかりました。このときのパラメータは因数基地の素因数が 30000 未満、f(r) の幅が 200000 です。パラメータをもっと大きくすればさらに大きな桁数でも成功すると思いますが、かなりの時間がかかるようになるでしょう。

補足 1) x_i ≡ f( x_i-1 ) ( mod N ) → y_i ≡ f( y_i-1 ) ( mod d ) の証明

x_i ≡ f( x_i-1 ) ( mod N ) より x_i - f( x_i-1 ) は N で割り切れるので、

を満たす整数 k が存在します。さらに d が N の素因数ならば

を満たす整数 k' が存在します。同様に、y_i ≡ x_i ( mod d ) なので、

を満たす整数 k_i, k_i-1 が存在します。(1) を(2) に代入して整理すると

となります。但し、二番目の変形には (3) を使っています。f( x_i-1 ) - f( x_i-1 - k_i-1d ) が d で割り切れるなら、右辺は d で割り切れるので証明できたことになります。そこで、

となって、f( x_i-1 ) - f( x_i-1 - k_i-1d ) が d で割り切れることが証明され、命題も証明されたことになります。

補足 2) 合同式の除算

ここで、素数 p を法として a / b がどんな値に合同になるのかを考えます。a が b に割り切れるとは限らないので、普通に考えれば整数ではなく有理数となりますが、

と考えることで、ちょうど割り切ることのできるような k を見つければ整数にできそうです。例として 5 / 3 ( mod 7 ) を考えると、

なので、4 に合同であると考えることができます。このとき、

となって、乗算の逆算となっていることに注意して下さい。

任意の数 a, b に対して a / b ≡ c ( mod p ) となる c が存在するかについては、a / b - c = kp より a - bc = kbp = dp と変形することで

となる c, d が存在すれば成り立ちます。ここで、「一次方程式定理」より、p, b が互いに素であれば

は必ず解 x, y を持つので、両辺を a 倍すれば解が得られることになります。さらに上式は

ということになり、a / b を計算する代わりに、一次方程式 bx + py = 1 を求めて ax を計算することでも c が得られることになります。

本章にあった合同式 2^1-p ( mod p ) は、2^p-1 ( mod p ) の逆数です。2^p-1 ≡ 1 ( mod p ) なので、

V_n + U_n√D	=	( αⁿ + βⁿ ) + [ ( αⁿ - βⁿ ) / √D ]√D
	=	2αⁿ
	=	2^1-n( P + √D )ⁿ

V_n+1 + U_n+1√D	=	2^1-(n+1)( P + √D )ⁿ⁺¹
	=	( P + √D )2^-n( P + √D )ⁿ
	=	(1/2)( P + √D )( V_n + U_n√D )
	=	(1/2)[ ( PV_n + DU_n ) + ( V_n + PU_n )√D ]

V_n+1 + U_n+1√D	=	2^1-(n+1)( P + √D )ⁿ⁺¹
	=	2^1-n( P + √D )^n-1・2^-1( P + √D )²
	=	2^1-n( P + √D )^n-1・2^-1( P² + 2P√D + D )
	=	2^1-n( P + √D )^n-1[ P² + P√D + ( D - P² ) / 2 ]
	=	2^1-n( P + √D )^n-1( P² + P√D - 2Q )
	=	2^1-nP( P + √D )ⁿ - 2^1+(1-n)Q( P + √D )^n-1
	=	P( V_n + U_n√D ) - Q( V_n-1 + U_n-1√D )
	=	( PV_n - QV_n-1 ) + ( PU_n - QU_n-1 )√D

V_m+n + U_m+n√D	=	2^1-(m+n)( P + √D )^m+n
	=	(1/2)2^1-m( P + √D )^m・2^1-n( P + √D )ⁿ
	=	(1/2)( V_m + U_m√D )( V_n + U_n√D )
	=	(1/2)[ ( V_mV_n + DU_mU_n ) + ( V_mU_n + V_nU_m )√D ]

( V_n + √DU_n )( V_n - √DU_n )	=	V_n² - DU_n²
	=	( αⁿ + βⁿ )² - ( αⁿ - βⁿ )²
	=	4αⁿβⁿ
	=	4[ ( P + √D )( P - √D ) / 4 ]ⁿ
	=	4[ ( P² - D ) / 4 ]ⁿ
	=	4Qⁿ

V_m-n + U_m-n√D	=	2^1-(m-n)( P + √D )^m-n
	=	2( V_m + U_m√D )( V_n + U_n√D )^-1
	=	2( V_m + U_m√D )( V_n - U_n√D ) / 4Qⁿ
	=	[ ( V_mV_n - DU_mU_n ) + ( V_nU_m - V_mU_n )√D ] / 2Qⁿ

V_n+1 = (1/2)( PV_n + DU_n )	--- (4.1.1)
U_n+1 = (1/2)( V_n + PU_n )	--- (4.1.2)
V_n+1 = PV_n - QV_n-1	--- (4.2.1)
U_n+1 = PU_n - QU_n-1	--- (4.2.2)
V_m+n = (1/2)( V_mV_n + DU_mU_n )	--- (4.3.1)
U_m+n = (1/2)( V_mU_n + V_nU_m )	--- (4.3.2)
U_2n = V_nU_n	--- (4.4)
V_n² - DU_n² = 4Qⁿ	--- (4.5)
V_m-n = ( V_mV_n - DU_mU_n ) / 2Qⁿ	--- (4.6.1)
U_m-n = ( V_nU_m - V_mU_n ) / 2Qⁿ	--- (4.6.2)
V_2n = V_n² - 2Qⁿ	--- (4.7)
V_2n+1 = V_nV_n+1 - PQⁿ	--- (4.8)

2U_p+1	=	V_pU₁ + V₁U_p
	=	V_p + PU_p
	≡	P + P( D / p ) ( mod p )
	≡	P[ ( D / p ) + 1 ] ( mod p )

2QU_p-1	=	V₁U_p - V_pU₁
	=	PU_p - V_p
	≡	P( D / p ) - P ( mod p )
	≡	P[ ( D / p ) - 1 ] ( mod p )

2V_p+1	=	V_pV₁ + DU_pU₁
	=	PV_p + DU_p
	≡	P² + D( D / p ) ( mod p )

2QV_p-1	=	V_pV₁ - DU_pU₁
	=	PV_p - DU_p
	≡	P² - D( D / p ) ( mod p )

V_(p+1)/2²	=	V_p+1 + 2n^(p+1)/2
	=	V_p+1 + 2n・n^(p-1)/2
	≡	2n + 2n( n / p ) ( mod p )
	≡	4n ( mod p )

V_k(p+1)	≡	V_k(p+1) + U_k(p+1)√D ( mod p )
	=	2^1-m(p+1)( P + √D )^m(p+1)
	=	2^1-m・[ 2^1-(p+1)( P + √D )^p+1 ]^m
	=	2^1-m・( V_p+1 + U_p+1√D )^m
	≡	2^1-m・2^m ( mod p )
	≡	2 ( mod p )

( 377² - 137069 )( 381² - 137069 )( 382² - 137069 )	=	( 377・381・382 )² - ( 377・381 + 381・382 + 382・377 )・137069 + ( 377 + 381 + 382 )・137069² - 137069³
	≡	( 377・381・382 )² ( mod 137069 )
	≡	( 2² x 5 x 7 x 11 x 17 x 23 )² ( mod 137069 )

f(r)	=	r² - N
	=	( 2k + 1 )² - ( 8m + s )
	=	4k( k + 1 ) - 8m - s + 1

f(r)	≅	N + ( M / 2 )² + i² - √N・M - Mi + 2√N・i - N
	=	( M / 2 )² + i² - √N・M - Mi + 2√N・i
	=	- √N・( M - 2i ) + ( M / 2 )² + i² - Mi

f( x_i-1 ) - f( x_i-1 - k_i-1d )	=	Σ_k( a_kx_i-1^k ) - Σ_k( a_k( x_i-1 - k_i-1d )^k )
	=	Σ_k( a_kx_i-1^k ) - Σ_k( a_kΣ_l( _kC_lx_i-1^l( -k_i-1d )^k-l ) )
	≡	Σ_k( a_kx_i-1^k ) - Σ_k( a_k_kC_kx_i-1^k ) ( mod d )
	=	Σ_k( a_kx_i-1^k ) - Σ_k( a_kx_i-1^k ) = 0

r = 538	89⁰ x 79⁰ x 59⁰ x 43¹ x 31¹ x 11¹ x 3³ x 2⁰ x (-1)¹
r = 593	89⁰ x 79¹ x 59⁰ x 43⁰ x 31⁰ x 11¹ x 3¹ x 2⁷ x (-1)¹
r = 623	89⁰ x 79⁰ x 59⁰ x 43¹ x 31⁰ x 11⁰ x 3³ x 2⁸ x (-1)¹
r = 671	89⁰ x 79¹ x 59⁰ x 43⁰ x 31¹ x 11⁰ x 3¹ x 2⁵ x (-1)¹
	↓
	89⁰ x 79² x 59⁰ x 43² x 31² x 11² x 3⁸ x 2²⁰ x (-1)⁴

y_i - f( y_i-1 )	=	f( x_i-1 ) - f( y_i-1 ) + k'd - k_id
	=	f( x_i-1 ) - f( x_i-1 - k_i-1d ) + k'd - k_id