eric2013 发表于 2023-10-13 00:31:27

浅谈MDK, IAR,CLANG和GCC的局部变量字节对齐处理差异(2023-10-13)

视频:

https://www.bilibili.com/video/BV1CB4y1Z7kA

https://www.bilibili.com/video/BV1CB4y1Z7kA

问题由来:

早期这个帖子里面的局部变量对齐仅测试了MDK AC5,但项目中使用AC6发现了新问题,看来AAPCS规约研究的还是不够细:

https://www.armbbs.cn/forum.php?mod=viewthread&tid=109400

当时对局部变量的描述如下:局部变量使用的是栈空间(除了静态局部变量和编译器优化不使用栈,直接用寄存器做变量空间),也就是大家使用在xxxx.S启动文件开辟的stack空间。

在M内核里面,局部变量的对齐问题如果研究起来是最烧脑的,这个涉及到AAPCS规约(Procedure Call Standard for the Arm Architecture,Arm架构的程序调用标准)。

https://img.anfulai.cn/dz/attachment/forum/202111/03/003507hzj111ejghzj1uwj.png

上面这个贴图最重要,仅需理解上面这两条就可以,意思是说,栈地址是全程至少保持4字节对齐的,因为M内核的硬件长做了处理,SP最低两个bit,bit0和bit1直接固定为0了。

但是在程序调用入口处必须满足8字节对齐,对于C语言,不需要用户去管,编译器都帮我们处理好了,先来个简单的示例压压惊:
https://img.anfulai.cn/dz/attachment/forum/202111/03/040108i8haxkbb55bk7bla.png

而汇编文件是需要用户去处理的。以xxx.S启动文件为例,通过伪指令PRESERVE8来保证

https://img.anfulai.cn/dz/attachment/forum/202111/03/010228xpvxukkyp44my4oy.png

那么问题来了,我们搞个4对齐是不是会出问题,一般情况下也没问题的,但特殊情况下不行,特别调用C库的sprintf和printf函数,直接给你输出个不知所以然的结果来。比如我在H7上做如下测试:

https://img.anfulai.cn/dz/attachment/forum/202111/03/023153gbufbvfvawa6jdf8.png
https://img.anfulai.cn/dz/attachment/forum/202111/03/014743mv0evqqki909k3zb.png

输出结果:

https://img.anfulai.cn/dz/attachment/forum/202111/03/015024ogyjz7gzhhosnajl.png


总结:

MDK AC5和IAR的用法差不多,MDK AC6和GCC的用法差不多(视频里面做了详细对比测试)。

对于GCC和MDK AC6,大家可以手动添加__ALIGNED()设置对齐,这个原定义在CMSIS软件的头文件里面。
GCC的定义如下:
#define __ALIGNED(x)                           __attribute__((aligned(x)))
AC6定义如下:
#define __ALIGNED(x)                           __attribute__((aligned(x)))


eric2013 发表于 2023-10-13 00:33:22


emwin 发表于 2023-10-13 13:41:34

本帖最后由 emwin 于 2023-10-13 13:50 编辑

IAR是这么描述的"The AEABI standard specifies that the stack pointer must be 8-byte aligned at function entry.",原文:




页: [1]
查看完整版本: 浅谈MDK, IAR,CLANG和GCC的局部变量字节对齐处理差异(2023-10-13)