Unified - adapt the generation of md5 assembler to use GENERATE
[oweals/openssl.git] / crypto / md5 / asm / md5-586.pl
1 #!/usr/local/bin/perl
2
3 # Normal is the
4 # md5_block_x86(MD5_CTX *c, ULONG *X);
5 # version, non-normal is the
6 # md5_block_x86(MD5_CTX *c, ULONG *X,int blocks);
7
8 $normal=0;
9
10 $0 =~ m/(.*[\/\\])[^\/\\]+$/; $dir=$1;
11 push(@INC,"${dir}","${dir}../../perlasm");
12 require "x86asm.pl";
13
14 $output=pop;
15 open STDOUT,">$output";
16
17 &asm_init($ARGV[0],$0);
18
19 $A="eax";
20 $B="ebx";
21 $C="ecx";
22 $D="edx";
23 $tmp1="edi";
24 $tmp2="ebp";
25 $X="esi";
26
27 # What we need to load into $tmp for the next round
28 %Ltmp1=("R0",&Np($C), "R1",&Np($C), "R2",&Np($C), "R3",&Np($D));
29 @xo=(
30  0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,  # R0
31  1, 6, 11, 0, 5, 10, 15, 4, 9, 14, 3, 8, 13, 2, 7, 12,  # R1
32  5, 8, 11, 14, 1, 4, 7, 10, 13, 0, 3, 6, 9, 12, 15, 2,  # R2
33  0, 7, 14, 5, 12, 3, 10, 1, 8, 15, 6, 13, 4, 11, 2, 9,  # R3
34  );
35
36 &md5_block("md5_block_asm_data_order");
37 &asm_finish();
38
39 close STDOUT;
40
41 sub Np
42         {
43         local($p)=@_;
44         local(%n)=($A,$D,$B,$A,$C,$B,$D,$C);
45         return($n{$p});
46         }
47
48 sub R0
49         {
50         local($pos,$a,$b,$c,$d,$K,$ki,$s,$t)=@_;
51
52         &mov($tmp1,$C)  if $pos < 0;
53         &mov($tmp2,&DWP($xo[$ki]*4,$K,"",0)) if $pos < 0; # very first one 
54
55         # body proper
56
57         &comment("R0 $ki");
58         &xor($tmp1,$d); # F function - part 2
59
60         &and($tmp1,$b); # F function - part 3
61         &lea($a,&DWP($t,$a,$tmp2,1));
62
63         &xor($tmp1,$d); # F function - part 4
64         &mov($tmp2,&DWP($xo[$ki+1]*4,$K,"",0)) if ($pos != 2);
65
66         &add($a,$tmp1);
67
68         &rotl($a,$s);
69
70         &mov($tmp1,&Np($c)) if $pos < 1;        # next tmp1 for R0
71         &mov($tmp1,&Np($c)) if $pos == 1;       # next tmp1 for R1
72
73         &add($a,$b);
74         }
75
76 sub R1
77         {
78         local($pos,$a,$b,$c,$d,$K,$ki,$s,$t)=@_;
79
80         &comment("R1 $ki");
81
82         &xor($tmp1,$b); # G function - part 2
83         &and($tmp1,$d); # G function - part 3
84         &lea($a,&DWP($t,$a,$tmp2,1));
85
86         &xor($tmp1,$c);                 # G function - part 4
87         &mov($tmp2,&DWP($xo[$ki+1]*4,$K,"",0)) if ($pos != 2);
88
89         &add($a,$tmp1);
90         &mov($tmp1,&Np($c)) if $pos < 1;        # G function - part 1
91         &mov($tmp1,&Np($c)) if $pos == 1;       # G function - part 1
92
93         &rotl($a,$s);
94
95         &add($a,$b);
96         }
97
98 sub R2
99         {
100         local($n,$pos,$a,$b,$c,$d,$K,$ki,$s,$t)=@_;
101         # This one is different, only 3 logical operations
102
103 if (($n & 1) == 0)
104         {
105         &comment("R2 $ki");
106         # make sure to do 'D' first, not 'B', else we clash with
107         # the last add from the previous round.
108
109         &xor($tmp1,$d); # H function - part 2
110
111         &xor($tmp1,$b); # H function - part 3
112         &lea($a,&DWP($t,$a,$tmp2,1));
113
114         &add($a,$tmp1);
115         &mov($tmp2,&DWP($xo[$ki+1]*4,$K,"",0));
116
117         &rotl($a,$s);
118
119         &mov($tmp1,&Np($c));
120         }
121 else
122         {
123         &comment("R2 $ki");
124         # make sure to do 'D' first, not 'B', else we clash with
125         # the last add from the previous round.
126
127         &add($b,$c);                    # MOVED FORWARD
128         &xor($tmp1,$d); # H function - part 2
129
130         &lea($a,&DWP($t,$a,$tmp2,1));
131
132         &xor($tmp1,$b); # H function - part 3
133         &mov($tmp2,&DWP($xo[$ki+1]*4,$K,"",0)) if ($pos != 2);
134
135         &add($a,$tmp1);
136         &mov($tmp1,&Np($c)) if $pos < 1;        # H function - part 1
137         &mov($tmp1,-1) if $pos == 1;            # I function - part 1
138
139         &rotl($a,$s);
140
141         &add($a,$b);
142         }
143         }
144
145 sub R3
146         {
147         local($pos,$a,$b,$c,$d,$K,$ki,$s,$t)=@_;
148
149         &comment("R3 $ki");
150
151         # &not($tmp1)
152         &xor($tmp1,$d) if $pos < 0;     # I function - part 2
153
154         &or($tmp1,$b);                          # I function - part 3
155         &lea($a,&DWP($t,$a,$tmp2,1));
156
157         &xor($tmp1,$c);                         # I function - part 4
158         &mov($tmp2,&DWP($xo[$ki+1]*4,$K,"",0))  if $pos != 2; # load X/k value
159         &mov($tmp2,&wparam(0)) if $pos == 2;
160
161         &add($a,$tmp1);
162         &mov($tmp1,-1) if $pos < 1;     # H function - part 1
163         &add($K,64) if $pos >=1 && !$normal;
164
165         &rotl($a,$s);
166
167         &xor($tmp1,&Np($d)) if $pos <= 0;       # I function - part = first time
168         &mov($tmp1,&DWP( 0,$tmp2,"",0)) if $pos > 0;
169         &add($a,$b);
170         }
171
172
173 sub md5_block
174         {
175         local($name)=@_;
176
177         &function_begin_B($name,"",3);
178
179         # parameter 1 is the MD5_CTX structure.
180         # A     0
181         # B     4
182         # C     8
183         # D     12
184
185         &push("esi");
186          &push("edi");
187         &mov($tmp1,     &wparam(0)); # edi
188          &mov($X,       &wparam(1)); # esi
189         &mov($C,        &wparam(2));
190          &push("ebp");
191         &shl($C,        6);
192         &push("ebx");
193          &add($C,       $X); # offset we end at
194         &sub($C,        64);
195          &mov($A,       &DWP( 0,$tmp1,"",0));
196         &push($C);      # Put on the TOS
197          &mov($B,       &DWP( 4,$tmp1,"",0));
198         &mov($C,        &DWP( 8,$tmp1,"",0));
199          &mov($D,       &DWP(12,$tmp1,"",0));
200
201         &set_label("start") unless $normal;
202         &comment("");
203         &comment("R0 section");
204
205         &R0(-2,$A,$B,$C,$D,$X, 0, 7,0xd76aa478);
206         &R0( 0,$D,$A,$B,$C,$X, 1,12,0xe8c7b756);
207         &R0( 0,$C,$D,$A,$B,$X, 2,17,0x242070db);
208         &R0( 0,$B,$C,$D,$A,$X, 3,22,0xc1bdceee);
209         &R0( 0,$A,$B,$C,$D,$X, 4, 7,0xf57c0faf);
210         &R0( 0,$D,$A,$B,$C,$X, 5,12,0x4787c62a);
211         &R0( 0,$C,$D,$A,$B,$X, 6,17,0xa8304613);
212         &R0( 0,$B,$C,$D,$A,$X, 7,22,0xfd469501);
213         &R0( 0,$A,$B,$C,$D,$X, 8, 7,0x698098d8);
214         &R0( 0,$D,$A,$B,$C,$X, 9,12,0x8b44f7af);
215         &R0( 0,$C,$D,$A,$B,$X,10,17,0xffff5bb1);
216         &R0( 0,$B,$C,$D,$A,$X,11,22,0x895cd7be);
217         &R0( 0,$A,$B,$C,$D,$X,12, 7,0x6b901122);
218         &R0( 0,$D,$A,$B,$C,$X,13,12,0xfd987193);
219         &R0( 0,$C,$D,$A,$B,$X,14,17,0xa679438e);
220         &R0( 1,$B,$C,$D,$A,$X,15,22,0x49b40821);
221
222         &comment("");
223         &comment("R1 section");
224         &R1(-1,$A,$B,$C,$D,$X,16, 5,0xf61e2562);
225         &R1( 0,$D,$A,$B,$C,$X,17, 9,0xc040b340);
226         &R1( 0,$C,$D,$A,$B,$X,18,14,0x265e5a51);
227         &R1( 0,$B,$C,$D,$A,$X,19,20,0xe9b6c7aa);
228         &R1( 0,$A,$B,$C,$D,$X,20, 5,0xd62f105d);
229         &R1( 0,$D,$A,$B,$C,$X,21, 9,0x02441453);
230         &R1( 0,$C,$D,$A,$B,$X,22,14,0xd8a1e681);
231         &R1( 0,$B,$C,$D,$A,$X,23,20,0xe7d3fbc8);
232         &R1( 0,$A,$B,$C,$D,$X,24, 5,0x21e1cde6);
233         &R1( 0,$D,$A,$B,$C,$X,25, 9,0xc33707d6);
234         &R1( 0,$C,$D,$A,$B,$X,26,14,0xf4d50d87);
235         &R1( 0,$B,$C,$D,$A,$X,27,20,0x455a14ed);
236         &R1( 0,$A,$B,$C,$D,$X,28, 5,0xa9e3e905);
237         &R1( 0,$D,$A,$B,$C,$X,29, 9,0xfcefa3f8);
238         &R1( 0,$C,$D,$A,$B,$X,30,14,0x676f02d9);
239         &R1( 1,$B,$C,$D,$A,$X,31,20,0x8d2a4c8a);
240
241         &comment("");
242         &comment("R2 section");
243         &R2( 0,-1,$A,$B,$C,$D,$X,32, 4,0xfffa3942);
244         &R2( 1, 0,$D,$A,$B,$C,$X,33,11,0x8771f681);
245         &R2( 2, 0,$C,$D,$A,$B,$X,34,16,0x6d9d6122);
246         &R2( 3, 0,$B,$C,$D,$A,$X,35,23,0xfde5380c);
247         &R2( 4, 0,$A,$B,$C,$D,$X,36, 4,0xa4beea44);
248         &R2( 5, 0,$D,$A,$B,$C,$X,37,11,0x4bdecfa9);
249         &R2( 6, 0,$C,$D,$A,$B,$X,38,16,0xf6bb4b60);
250         &R2( 7, 0,$B,$C,$D,$A,$X,39,23,0xbebfbc70);
251         &R2( 8, 0,$A,$B,$C,$D,$X,40, 4,0x289b7ec6);
252         &R2( 9, 0,$D,$A,$B,$C,$X,41,11,0xeaa127fa);
253         &R2(10, 0,$C,$D,$A,$B,$X,42,16,0xd4ef3085);
254         &R2(11, 0,$B,$C,$D,$A,$X,43,23,0x04881d05);
255         &R2(12, 0,$A,$B,$C,$D,$X,44, 4,0xd9d4d039);
256         &R2(13, 0,$D,$A,$B,$C,$X,45,11,0xe6db99e5);
257         &R2(14, 0,$C,$D,$A,$B,$X,46,16,0x1fa27cf8);
258         &R2(15, 1,$B,$C,$D,$A,$X,47,23,0xc4ac5665);
259
260         &comment("");
261         &comment("R3 section");
262         &R3(-1,$A,$B,$C,$D,$X,48, 6,0xf4292244);
263         &R3( 0,$D,$A,$B,$C,$X,49,10,0x432aff97);
264         &R3( 0,$C,$D,$A,$B,$X,50,15,0xab9423a7);
265         &R3( 0,$B,$C,$D,$A,$X,51,21,0xfc93a039);
266         &R3( 0,$A,$B,$C,$D,$X,52, 6,0x655b59c3);
267         &R3( 0,$D,$A,$B,$C,$X,53,10,0x8f0ccc92);
268         &R3( 0,$C,$D,$A,$B,$X,54,15,0xffeff47d);
269         &R3( 0,$B,$C,$D,$A,$X,55,21,0x85845dd1);
270         &R3( 0,$A,$B,$C,$D,$X,56, 6,0x6fa87e4f);
271         &R3( 0,$D,$A,$B,$C,$X,57,10,0xfe2ce6e0);
272         &R3( 0,$C,$D,$A,$B,$X,58,15,0xa3014314);
273         &R3( 0,$B,$C,$D,$A,$X,59,21,0x4e0811a1);
274         &R3( 0,$A,$B,$C,$D,$X,60, 6,0xf7537e82);
275         &R3( 0,$D,$A,$B,$C,$X,61,10,0xbd3af235);
276         &R3( 0,$C,$D,$A,$B,$X,62,15,0x2ad7d2bb);
277         &R3( 2,$B,$C,$D,$A,$X,63,21,0xeb86d391);
278
279         # &mov($tmp2,&wparam(0));       # done in the last R3
280         # &mov($tmp1,   &DWP( 0,$tmp2,"",0)); # done is the last R3
281
282         &add($A,$tmp1);
283          &mov($tmp1,    &DWP( 4,$tmp2,"",0));
284
285         &add($B,$tmp1);
286         &mov($tmp1,     &DWP( 8,$tmp2,"",0));
287
288         &add($C,$tmp1);
289         &mov($tmp1,     &DWP(12,$tmp2,"",0));
290
291         &add($D,$tmp1);
292         &mov(&DWP( 0,$tmp2,"",0),$A);
293
294         &mov(&DWP( 4,$tmp2,"",0),$B);
295         &mov($tmp1,&swtmp(0)) unless $normal;
296
297         &mov(&DWP( 8,$tmp2,"",0),$C);
298          &mov(&DWP(12,$tmp2,"",0),$D);
299
300         &cmp($tmp1,$X) unless $normal;                  # check count
301          &jae(&label("start")) unless $normal;
302
303         &pop("eax"); # pop the temp variable off the stack
304          &pop("ebx");
305         &pop("ebp");
306          &pop("edi");
307         &pop("esi");
308          &ret();
309         &function_end_B($name);
310         }
311