10 #include <botan/square.h>    11 #include <botan/loadstor.h>    12 #include <botan/rotate.h>    21    for(
size_t i = 0; i != blocks; ++i)
    25       B0 = TE0[in[ 0] ^ ME[ 0]] ^ TE1[in[ 4] ^ ME[ 4]] ^
    26            TE2[in[ 8] ^ ME[ 8]] ^ TE3[in[12] ^ ME[12]] ^ EK[0];
    27       B1 = TE0[in[ 1] ^ ME[ 1]] ^ TE1[in[ 5] ^ ME[ 5]] ^
    28            TE2[in[ 9] ^ ME[ 9]] ^ TE3[in[13] ^ ME[13]] ^ EK[1];
    29       B2 = TE0[in[ 2] ^ ME[ 2]] ^ TE1[in[ 6] ^ ME[ 6]] ^
    30            TE2[in[10] ^ ME[10]] ^ TE3[in[14] ^ ME[14]] ^ EK[2];
    31       B3 = TE0[in[ 3] ^ ME[ 3]] ^ TE1[in[ 7] ^ ME[ 7]] ^
    32            TE2[in[11] ^ ME[11]] ^ TE3[in[15] ^ ME[15]] ^ EK[3];
    34       for(
size_t j = 1; j != 7; j += 2)
    56       out[ 0] = SE[
get_byte(0, B0)] ^ ME[16];
    57       out[ 1] = SE[
get_byte(0, B1)] ^ ME[17];
    58       out[ 2] = SE[
get_byte(0, B2)] ^ ME[18];
    59       out[ 3] = SE[
get_byte(0, B3)] ^ ME[19];
    60       out[ 4] = SE[
get_byte(1, B0)] ^ ME[20];
    61       out[ 5] = SE[
get_byte(1, B1)] ^ ME[21];
    62       out[ 6] = SE[
get_byte(1, B2)] ^ ME[22];
    63       out[ 7] = SE[
get_byte(1, B3)] ^ ME[23];
    64       out[ 8] = SE[
get_byte(2, B0)] ^ ME[24];
    65       out[ 9] = SE[
get_byte(2, B1)] ^ ME[25];
    66       out[10] = SE[
get_byte(2, B2)] ^ ME[26];
    67       out[11] = SE[
get_byte(2, B3)] ^ ME[27];
    68       out[12] = SE[
get_byte(3, B0)] ^ ME[28];
    69       out[13] = SE[
get_byte(3, B1)] ^ ME[29];
    70       out[14] = SE[
get_byte(3, B2)] ^ ME[30];
    71       out[15] = SE[
get_byte(3, B3)] ^ ME[31];
    83    for(
size_t i = 0; i != blocks; ++i)
    87       B0 = TD0[in[ 0] ^ MD[ 0]] ^ TD1[in[ 4] ^ MD[ 4]] ^
    88            TD2[in[ 8] ^ MD[ 8]] ^ TD3[in[12] ^ MD[12]] ^ DK[0];
    89       B1 = TD0[in[ 1] ^ MD[ 1]] ^ TD1[in[ 5] ^ MD[ 5]] ^
    90            TD2[in[ 9] ^ MD[ 9]] ^ TD3[in[13] ^ MD[13]] ^ DK[1];
    91       B2 = TD0[in[ 2] ^ MD[ 2]] ^ TD1[in[ 6] ^ MD[ 6]] ^
    92            TD2[in[10] ^ MD[10]] ^ TD3[in[14] ^ MD[14]] ^ DK[2];
    93       B3 = TD0[in[ 3] ^ MD[ 3]] ^ TD1[in[ 7] ^ MD[ 7]] ^
    94            TD2[in[11] ^ MD[11]] ^ TD3[in[15] ^ MD[15]] ^ DK[3];
    96       for(
size_t j = 1; j != 7; j += 2)
   118       out[ 0] = SD[
get_byte(0, B0)] ^ MD[16];
   119       out[ 1] = SD[
get_byte(0, B1)] ^ MD[17];
   120       out[ 2] = SD[
get_byte(0, B2)] ^ MD[18];
   121       out[ 3] = SD[
get_byte(0, B3)] ^ MD[19];
   122       out[ 4] = SD[
get_byte(1, B0)] ^ MD[20];
   123       out[ 5] = SD[
get_byte(1, B1)] ^ MD[21];
   124       out[ 6] = SD[
get_byte(1, B2)] ^ MD[22];
   125       out[ 7] = SD[
get_byte(1, B3)] ^ MD[23];
   126       out[ 8] = SD[
get_byte(2, B0)] ^ MD[24];
   127       out[ 9] = SD[
get_byte(2, B1)] ^ MD[25];
   128       out[10] = SD[
get_byte(2, B2)] ^ MD[26];
   129       out[11] = SD[
get_byte(2, B3)] ^ MD[27];
   130       out[12] = SD[
get_byte(3, B0)] ^ MD[28];
   131       out[13] = SD[
get_byte(3, B1)] ^ MD[29];
   132       out[14] = SD[
get_byte(3, B2)] ^ MD[30];
   133       out[15] = SD[
get_byte(3, B3)] ^ MD[31];
   143 void Square::key_schedule(
const byte key[], 
size_t)
   147    for(
size_t i = 0; i != 4; ++i)
   150    for(
size_t i = 0; i != 8; ++i)
   152       XEK[4*i+4] = XEK[4*i  ] ^ 
rotate_left(XEK[4*i+3], 8) ^ (0x01000000 << i);
   153       XEK[4*i+5] = XEK[4*i+1] ^ XEK[4*i+4];
   154       XEK[4*i+6] = XEK[4*i+2] ^ XEK[4*i+5];
   155       XEK[4*i+7] = XEK[4*i+3] ^ XEK[4*i+6];
   157       for(
size_t j = 0; j != 4; ++j)
   158          XDK[28 - 4*i + j] = XEK[4*(i+1)+j];
   160       transform(&XEK[4*i]);
   163    for(
size_t i = 0; i != 4; ++i)
   164       for(
size_t j = 0; j != 4; ++j)
   167          ME[4*i+j+16] = 
get_byte(j, XEK[i+32]);
   169          MD[4*i+j+16] = 
get_byte(j, XEK[i   ]);
   172    EK.
copy(&XEK[4], 28);
   173    DK.
copy(&XDK[4], 28);
   179 void Square::transform(
u32bit round_key[4])
   181    static const byte G[4][4] = {
   187    for(
size_t i = 0; i != 4; ++i)
   189       byte A[4] = { 0 }, B[4] = { 0 };
   193       for(
size_t j = 0; j != 4; ++j)
   194          for(
size_t k = 0; k != 4; ++k)
   197             const byte b = G[k][j];
   200                B[j] ^= ALog[(Log[a] + Log[b]) % 255];
 
void encrypt_n(const byte in[], byte out[], size_t blocks) const
T rotate_left(T input, size_t rot)
byte get_byte(size_t byte_num, T input)
void copy(const T in[], size_t n)
void decrypt_n(const byte in[], byte out[], size_t blocks) const
u32bit load_be< u32bit >(const byte in[], size_t off)
void store_be(u16bit in, byte out[2])
void zeroise(MemoryRegion< T > &vec)