d98b915983c22060ff0a964b339c7f9907b271b5
[blender-staging.git] / source / blender / blenlib / intern / hash_md5.c
1 /*
2  * ***** BEGIN GPL LICENSE BLOCK *****
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License
6  * as published by the Free Software Foundation; either version 2
7  * of the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software Foundation,
16  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
17  *
18  * ***** END GPL LICENSE BLOCK *****
19  *
20  * Copyright (C) 1995 Software Foundation, Inc.
21  *
22  * Written by Ulrich Drepper <drepper@gnu.ai.mit.edu>.
23  */
24
25 /** \file blender/blenlib/intern/hash_md5.c
26  *  \ingroup bli
27  *
28  *  Functions to compute MD5 message digest of files or memory blocks
29  *  according to the definition of MD5 in RFC 1321 from April 1992.
30  */
31
32 #include <stdlib.h>
33 #include <string.h>
34 #include <stdio.h>
35 #include <sys/types.h>
36
37 #include "BLI_hash_md5.h"  /* own include */
38
39 #if defined HAVE_LIMITS_H || defined _LIBC
40 #  include <limits.h>
41 #endif
42
43 /* The following contortions are an attempt to use the C preprocessor to determine an unsigned integral type
44  * that is 32 bits wide. An alternative approach is to use autoconf's AC_CHECK_SIZEOF macro, but doing that
45  * would require that the configure script compile and *run* the resulting executable.
46  * Locally running cross-compiled executables is usually not possible.
47  */
48
49 #if defined __STDC__ && __STDC__
50 #  define UINT_MAX_32_BITS 4294967295U
51 #else
52 #  define UINT_MAX_32_BITS 0xFFFFFFFF
53 #endif
54
55 /* If UINT_MAX isn't defined, assume it's a 32-bit type.
56  * This should be valid for all systems GNU cares about because that doesn't include 16-bit systems,
57  * and only modern systems (that certainly have <limits.h>) have 64+-bit integral types.
58  */
59
60 #ifndef UINT_MAX
61 #  define UINT_MAX UINT_MAX_32_BITS
62 #endif
63
64 #if UINT_MAX == UINT_MAX_32_BITS
65    typedef unsigned int md5_uint32;
66 #else
67 #  if USHRT_MAX == UINT_MAX_32_BITS
68      typedef unsigned short md5_uint32;
69 #  else
70 #    if ULONG_MAX == UINT_MAX_32_BITS
71        typedef unsigned long md5_uint32;
72 #    else
73        /* The following line is intended to evoke an error. Using #error is not portable enough. */
74        "Cannot determine unsigned 32-bit data type."
75 #    endif
76 #  endif
77 #endif
78
79
80 /* Following code is low level, upon which are built up the functions
81  * 'BLI_hash_md5_stream' and 'BLI_hash_md5_buffer'. */
82
83 /* Structure to save state of computation between the single steps. */
84 struct md5_ctx {
85         md5_uint32 A;
86         md5_uint32 B;
87         md5_uint32 C;
88         md5_uint32 D;
89 };
90
91 #ifdef __BIG_ENDIAN__
92 #  define SWAP(n) (((n) << 24) | (((n) & 0xff00) << 8) | (((n) >> 8) & 0xff00) | ((n) >> 24))
93 #else
94 #  define SWAP(n) (n)
95 #endif
96
97 /* This array contains the bytes used to pad the buffer to the next 64-byte boundary.  (RFC 1321, 3.1: Step 1) */
98 static const unsigned char fillbuf[64] = {0x80, 0 /* , 0, 0, ...  */};
99
100 /** Initialize structure containing state of computation.
101  *  (RFC 1321, 3.3: Step 3)
102  */
103 static void md5_init_ctx(struct md5_ctx *ctx)
104 {
105         ctx->A = 0x67452301;
106         ctx->B = 0xefcdab89;
107         ctx->C = 0x98badcfe;
108         ctx->D = 0x10325476;
109 }
110
111 /** Starting with the result of former calls of this function (or the initialization), this function updates
112  *  the 'ctx' context for the next 'len' bytes starting at 'buffer'.
113  *  It is necessary that 'len' is a multiple of 64!!!
114  */
115 static void md5_process_block (const void *buffer, size_t len, struct md5_ctx *ctx)
116 {
117 /* These are the four functions used in the four steps of the MD5 algorithm and defined in the RFC 1321.
118  * The first function is a little bit optimized (as found in Colin Plumbs public domain implementation).
119  */
120 /* #define FF(b, c, d) ((b & c) | (~b & d)) */
121 #define FF(b, c, d) (d ^ (b & (c ^ d)))
122 #define FG(b, c, d) FF (d, b, c)
123 #define FH(b, c, d) (b ^ c ^ d)
124 #define FI(b, c, d) (c ^ (b | ~d))
125
126 /* It is unfortunate that C does not provide an operator for cyclic rotation.  Hope the C compiler is smart enough. */
127 #define CYCLIC(w, s) (w = (w << s) | (w >> (32 - s)))
128
129         md5_uint32 correct_words[16];
130         const md5_uint32 *words = buffer;
131         size_t nwords = len / sizeof(md5_uint32);
132         const md5_uint32 *endp = words + nwords;
133         md5_uint32 A = ctx->A;
134         md5_uint32 B = ctx->B;
135         md5_uint32 C = ctx->C;
136         md5_uint32 D = ctx->D;
137
138         /* Process all bytes in the buffer with 64 bytes in each round of the loop.  */
139         while (words < endp) {
140                 md5_uint32 *cwp = correct_words;
141                 md5_uint32 A_save = A;
142                 md5_uint32 B_save = B;
143                 md5_uint32 C_save = C;
144                 md5_uint32 D_save = D;
145
146                 /* First round: using the given function, the context and a constant the next context is computed.
147                  * Because the algorithms processing unit is a 32-bit word and it is determined to work on words in
148                  * little endian byte order we perhaps have to change the byte order before the computation.
149                  * To reduce the work for the next steps we store the swapped words in the array CORRECT_WORDS.
150                  */
151 #define OP(a, b, c, d, s, T)                                   \
152                 a += FF(b, c, d) + (*cwp++ = SWAP(*words)) + T;        \
153                 ++words;                                               \
154                 CYCLIC(a, s);                                          \
155                 a += b;                                                \
156                 (void)0
157
158                 /* Before we start, one word to the strange constants. They are defined in RFC 1321 as:
159                  *     T[i] = (int) (4294967296.0 * fabs (sin (i))), i=1..64
160                  */
161
162                 /* Round 1.  */
163                 OP(A, B, C, D,  7, 0xd76aa478);
164                 OP(D, A, B, C, 12, 0xe8c7b756);
165                 OP(C, D, A, B, 17, 0x242070db);
166                 OP(B, C, D, A, 22, 0xc1bdceee);
167                 OP(A, B, C, D,  7, 0xf57c0faf);
168                 OP(D, A, B, C, 12, 0x4787c62a);
169                 OP(C, D, A, B, 17, 0xa8304613);
170                 OP(B, C, D, A, 22, 0xfd469501);
171                 OP(A, B, C, D,  7, 0x698098d8);
172                 OP(D, A, B, C, 12, 0x8b44f7af);
173                 OP(C, D, A, B, 17, 0xffff5bb1);
174                 OP(B, C, D, A, 22, 0x895cd7be);
175                 OP(A, B, C, D,  7, 0x6b901122);
176                 OP(D, A, B, C, 12, 0xfd987193);
177                 OP(C, D, A, B, 17, 0xa679438e);
178                 OP(B, C, D, A, 22, 0x49b40821);
179
180 #undef OP
181
182                 /* For the second to fourth round we have the possibly swapped words in CORRECT_WORDS.
183                  * Redefine the macro to take an additional first argument specifying the function to use.
184                  */
185 #define OP(f, a, b, c, d, k, s, T)                             \
186                 a += f(b, c, d) + correct_words[k] + T;                \
187                 CYCLIC(a, s);                                          \
188                 a += b;                                                \
189                 (void)0
190
191                 /* Round 2.  */
192                 OP(FG, A, B, C, D,  1,  5, 0xf61e2562);
193                 OP(FG, D, A, B, C,  6,  9, 0xc040b340);
194                 OP(FG, C, D, A, B, 11, 14, 0x265e5a51);
195                 OP(FG, B, C, D, A,  0, 20, 0xe9b6c7aa);
196                 OP(FG, A, B, C, D,  5,  5, 0xd62f105d);
197                 OP(FG, D, A, B, C, 10,  9, 0x02441453);
198                 OP(FG, C, D, A, B, 15, 14, 0xd8a1e681);
199                 OP(FG, B, C, D, A,  4, 20, 0xe7d3fbc8);
200                 OP(FG, A, B, C, D,  9,  5, 0x21e1cde6);
201                 OP(FG, D, A, B, C, 14,  9, 0xc33707d6);
202                 OP(FG, C, D, A, B,  3, 14, 0xf4d50d87);
203                 OP(FG, B, C, D, A,  8, 20, 0x455a14ed);
204                 OP(FG, A, B, C, D, 13,  5, 0xa9e3e905);
205                 OP(FG, D, A, B, C,  2,  9, 0xfcefa3f8);
206                 OP(FG, C, D, A, B,  7, 14, 0x676f02d9);
207                 OP(FG, B, C, D, A, 12, 20, 0x8d2a4c8a);
208
209                 /* Round 3.  */
210                 OP(FH, A, B, C, D,  5,  4, 0xfffa3942);
211                 OP(FH, D, A, B, C,  8, 11, 0x8771f681);
212                 OP(FH, C, D, A, B, 11, 16, 0x6d9d6122);
213                 OP(FH, B, C, D, A, 14, 23, 0xfde5380c);
214                 OP(FH, A, B, C, D,  1,  4, 0xa4beea44);
215                 OP(FH, D, A, B, C,  4, 11, 0x4bdecfa9);
216                 OP(FH, C, D, A, B,  7, 16, 0xf6bb4b60);
217                 OP(FH, B, C, D, A, 10, 23, 0xbebfbc70);
218                 OP(FH, A, B, C, D, 13,  4, 0x289b7ec6);
219                 OP(FH, D, A, B, C,  0, 11, 0xeaa127fa);
220                 OP(FH, C, D, A, B,  3, 16, 0xd4ef3085);
221                 OP(FH, B, C, D, A,  6, 23, 0x04881d05);
222                 OP(FH, A, B, C, D,  9,  4, 0xd9d4d039);
223                 OP(FH, D, A, B, C, 12, 11, 0xe6db99e5);
224                 OP(FH, C, D, A, B, 15, 16, 0x1fa27cf8);
225                 OP(FH, B, C, D, A,  2, 23, 0xc4ac5665);
226
227                 /* Round 4.  */
228                 OP(FI, A, B, C, D,  0,  6, 0xf4292244);
229                 OP(FI, D, A, B, C,  7, 10, 0x432aff97);
230                 OP(FI, C, D, A, B, 14, 15, 0xab9423a7);
231                 OP(FI, B, C, D, A,  5, 21, 0xfc93a039);
232                 OP(FI, A, B, C, D, 12,  6, 0x655b59c3);
233                 OP(FI, D, A, B, C,  3, 10, 0x8f0ccc92);
234                 OP(FI, C, D, A, B, 10, 15, 0xffeff47d);
235                 OP(FI, B, C, D, A,  1, 21, 0x85845dd1);
236                 OP(FI, A, B, C, D,  8,  6, 0x6fa87e4f);
237                 OP(FI, D, A, B, C, 15, 10, 0xfe2ce6e0);
238                 OP(FI, C, D, A, B,  6, 15, 0xa3014314);
239                 OP(FI, B, C, D, A, 13, 21, 0x4e0811a1);
240                 OP(FI, A, B, C, D,  4,  6, 0xf7537e82);
241                 OP(FI, D, A, B, C, 11, 10, 0xbd3af235);
242                 OP(FI, C, D, A, B,  2, 15, 0x2ad7d2bb);
243                 OP(FI, B, C, D, A,  9, 21, 0xeb86d391);
244
245 #undef OP
246
247                 /* Add the starting values of the context.  */
248                 A += A_save;
249                 B += B_save;
250                 C += C_save;
251                 D += D_save;
252         }
253
254         /* Put checksum in context given as argument.  */
255         ctx->A = A;
256         ctx->B = B;
257         ctx->C = C;
258         ctx->D = D;
259
260 #undef FF
261 #undef FG
262 #undef FH
263 #undef FI
264 #undef CYCLIC
265 }
266
267 /** Put result from 'ctx' in first 16 bytes of 'resbuf'. The result is always in little endian byte order,
268  *  so that a byte-wise output yields to the wanted ASCII representation of the message digest.
269  */
270 static void *md5_read_ctx(const struct md5_ctx *ctx, void *resbuf)
271 {
272         md5_uint32 *digest = resbuf;
273         digest[0] = SWAP(ctx->A);
274         digest[1] = SWAP(ctx->B);
275         digest[2] = SWAP(ctx->C);
276         digest[3] = SWAP(ctx->D);
277
278         return resbuf;
279 }
280
281 /* Top level public functions. */
282
283 /** Compute MD5 message digest for bytes read from 'stream'.
284  *  The resulting message digest number will be written into the 16 bytes beginning at 'resblock'.
285  *  \return Non-zero if an error occurred.
286  */
287 int BLI_hash_md5_stream(FILE *stream, void *resblock)
288 {
289 #define BLOCKSIZE 4096  /* Important: must be a multiple of 64. */
290         struct md5_ctx ctx;
291         md5_uint32 len[2];
292         char buffer[BLOCKSIZE + 72];
293         size_t pad, sum;
294
295         /* Initialize the computation context. */
296         md5_init_ctx(&ctx);
297
298         len[0] = 0;
299         len[1] = 0;
300
301         /* Iterate over full file contents. */
302         while (1) {
303                 /* We read the file in blocks of BLOCKSIZE bytes. One call of the computation function processes
304                  * the whole buffer so that with the next round of the loop another block can be read.
305                  */
306                 size_t n;
307                 sum = 0;
308
309                 /* Read block. Take care for partial reads. */
310                 do {
311                         n = fread(buffer, 1, BLOCKSIZE - sum, stream);
312                         sum += n;
313                 } while (sum < BLOCKSIZE && n != 0);
314
315                 if (n == 0 && ferror(stream))
316                         return 1;
317
318                 /* RFC 1321 specifies the possible length of the file up to 2^64 bits.
319                  * Here we only compute the number of bytes. Do a double word increment.
320                  */
321                 len[0] += sum;
322                 if (len[0] < sum)
323                         ++len[1];
324
325                 /* If end of file is reached, end the loop.  */
326                 if (n == 0)
327                         break;
328
329                 /* Process buffer with BLOCKSIZE bytes. Note that BLOCKSIZE % 64 == 0. */
330                 md5_process_block(buffer, BLOCKSIZE, &ctx);
331         }
332
333         /* We can copy 64 bytes because the buffer is always big enough. 'fillbuf' contains the needed bits. */
334         memcpy(&buffer[sum], fillbuf, 64);
335
336         /* Compute amount of padding bytes needed. Alignment is done to (N + PAD) % 64 == 56.
337          * There is always at least one byte padded, i.e. if the alignment is correctly aligned,
338          * 64 padding bytes are added.
339          */
340         pad = sum & 63;
341         pad = pad >= 56 ? 64 + 56 - pad : 56 - pad;
342
343         /* Put the 64-bit file length in *bits* at the end of the buffer. */
344         *(md5_uint32 *) &buffer[sum + pad] = SWAP(len[0] << 3);
345         *(md5_uint32 *) &buffer[sum + pad + 4] = SWAP((len[1] << 3) | (len[0] >> 29));
346
347         /* Process last bytes.  */
348         md5_process_block(buffer, sum + pad + 8, &ctx);
349
350         /* Construct result in desired memory.  */
351         md5_read_ctx(&ctx, resblock);
352         return 0;
353 }
354
355 /** Compute MD5 message digest for 'len' bytes beginning at 'buffer'.
356  *  The result is always in little endian byte order, so that a byte-wise output yields to the wanted
357  *  ASCII representation of the message digest.
358  */
359 void *BLI_hash_md5_buffer(const char *buffer, size_t len, void *resblock)
360 {
361         struct md5_ctx ctx;
362         char restbuf[64 + 72];
363         size_t blocks = len & ~63;
364         size_t pad, rest;
365
366         /* Initialize the computation context.  */
367         md5_init_ctx(&ctx);
368
369         /* Process whole buffer but last len % 64 bytes.  */
370         md5_process_block(buffer, blocks, &ctx);
371
372         /* REST bytes are not processed yet.  */
373         rest = len - blocks;
374         /* Copy to own buffer.  */
375         memcpy(restbuf, &buffer[blocks], rest);
376         /* Append needed fill bytes at end of buffer. We can copy 64 bytes because the buffer is always big enough. */
377         memcpy(&restbuf[rest], fillbuf, 64);
378
379         /* PAD bytes are used for padding to correct alignment. Note that always at least one byte is padded. */
380         pad = rest >= 56 ? 64 + 56 - rest : 56 - rest;
381
382         /* Put length of buffer in *bits* in last eight bytes. */
383         *(md5_uint32 *) &restbuf[rest + pad] = (md5_uint32) SWAP(len << 3);
384         *(md5_uint32 *) &restbuf[rest + pad + 4] = (md5_uint32) SWAP(len >> 29);
385
386         /* Process last bytes. */
387         md5_process_block(restbuf, rest + pad + 8, &ctx);
388
389         /* Put result in desired memory area. */
390         return md5_read_ctx(&ctx, resblock);
391 }
392
393 char *BLI_hash_md5_to_hexdigest(void *resblock, char r_hex_digest[33])
394 {
395         static const char hex_map[17] = "0123456789abcdef";
396         const unsigned char *p;
397         char *q;
398         short len;
399
400         for (q = r_hex_digest, p = (const unsigned char *)resblock, len = 0; len < 16; ++p, ++len) {
401                 const unsigned char c = *p;
402                 *q++ = hex_map[c >> 4];
403                 *q++ = hex_map[c & 15];
404         }
405         *q = '\0';
406
407         return r_hex_digest;
408 }