add thumb2 support to arm assembler memcpy
authorAndre McCurdy <armccurdy@gmail.com>
Fri, 13 Sep 2019 18:44:31 +0000 (11:44 -0700)
committerRich Felker <dalias@aerifal.cx>
Thu, 16 Jan 2020 20:44:26 +0000 (15:44 -0500)
For Thumb2 compatibility, replace two instances of a single
instruction "orr with a variable shift" with the two instruction
equivalent. Neither of the replacements are in a performance critical
loop.

src/string/arm/memcpy.c
src/string/arm/memcpy_le.S

index f703c9bdf7c7b4cb516886e6c8b39f58a76aaaa6..041614f4ba3adaae3dfc31a7304846510e43162d 100644 (file)
@@ -1,3 +1,3 @@
-#if __ARMEB__ || __thumb__
+#if __ARMEB__
 #include "../memcpy.c"
 #endif
index 9cfbcb2ab7887ba9f8e0f9fe9e7b4417d276a1e7..7b35d305ec615c33953494da73f45205611741db 100644 (file)
@@ -1,4 +1,4 @@
-#if !__ARMEB__ && !__thumb__
+#if !__ARMEB__
 
 /*
  * Copyright (C) 2008 The Android Open Source Project
@@ -40,8 +40,9 @@
  * This file has been modified from the original for use in musl libc.
  * The main changes are: addition of .type memcpy,%function to make the
  * code safely callable from thumb mode, adjusting the return
- * instructions to be compatible with pre-thumb ARM cpus, and removal
- * of prefetch code that is not compatible with older cpus.
+ * instructions to be compatible with pre-thumb ARM cpus, removal of
+ * prefetch code that is not compatible with older cpus and support for
+ * building as thumb 2.
  */
 
 .syntax unified
@@ -241,7 +242,8 @@ non_congruent:
        beq     2f
        ldr     r5, [r1], #4
        sub     r2, r2, #4
-       orr     r4, r3, r5,             lsl lr
+       mov     r4, r5,                 lsl lr
+       orr     r4, r4, r3
        mov     r3, r5,                 lsr r12
        str     r4, [r0], #4
        cmp     r2, #4
@@ -348,7 +350,8 @@ less_than_thirtytwo:
 
 1:      ldr     r5, [r1], #4
        sub     r2, r2, #4
-       orr     r4, r3, r5,             lsl lr
+       mov     r4, r5,                 lsl lr
+       orr     r4, r4, r3
        mov     r3,     r5,                     lsr r12
        str     r4, [r0], #4
        cmp     r2, #4