Add qemu 2.4.0
[kvmfornfv.git] / qemu / linux-user / elfload.c
1 /* This is the Linux kernel elf-loading code, ported into user space */
2 #include <sys/time.h>
3 #include <sys/param.h>
4
5 #include <stdio.h>
6 #include <sys/types.h>
7 #include <fcntl.h>
8 #include <errno.h>
9 #include <unistd.h>
10 #include <sys/mman.h>
11 #include <sys/resource.h>
12 #include <stdlib.h>
13 #include <string.h>
14 #include <time.h>
15
16 #include "qemu.h"
17 #include "disas/disas.h"
18
19 #ifdef _ARCH_PPC64
20 #undef ARCH_DLINFO
21 #undef ELF_PLATFORM
22 #undef ELF_HWCAP
23 #undef ELF_HWCAP2
24 #undef ELF_CLASS
25 #undef ELF_DATA
26 #undef ELF_ARCH
27 #endif
28
29 #define ELF_OSABI   ELFOSABI_SYSV
30
31 /* from personality.h */
32
33 /*
34  * Flags for bug emulation.
35  *
36  * These occupy the top three bytes.
37  */
38 enum {
39     ADDR_NO_RANDOMIZE = 0x0040000,      /* disable randomization of VA space */
40     FDPIC_FUNCPTRS =    0x0080000,      /* userspace function ptrs point to
41                                            descriptors (signal handling) */
42     MMAP_PAGE_ZERO =    0x0100000,
43     ADDR_COMPAT_LAYOUT = 0x0200000,
44     READ_IMPLIES_EXEC = 0x0400000,
45     ADDR_LIMIT_32BIT =  0x0800000,
46     SHORT_INODE =       0x1000000,
47     WHOLE_SECONDS =     0x2000000,
48     STICKY_TIMEOUTS =   0x4000000,
49     ADDR_LIMIT_3GB =    0x8000000,
50 };
51
52 /*
53  * Personality types.
54  *
55  * These go in the low byte.  Avoid using the top bit, it will
56  * conflict with error returns.
57  */
58 enum {
59     PER_LINUX =         0x0000,
60     PER_LINUX_32BIT =   0x0000 | ADDR_LIMIT_32BIT,
61     PER_LINUX_FDPIC =   0x0000 | FDPIC_FUNCPTRS,
62     PER_SVR4 =          0x0001 | STICKY_TIMEOUTS | MMAP_PAGE_ZERO,
63     PER_SVR3 =          0x0002 | STICKY_TIMEOUTS | SHORT_INODE,
64     PER_SCOSVR3 =       0x0003 | STICKY_TIMEOUTS | WHOLE_SECONDS | SHORT_INODE,
65     PER_OSR5 =          0x0003 | STICKY_TIMEOUTS | WHOLE_SECONDS,
66     PER_WYSEV386 =      0x0004 | STICKY_TIMEOUTS | SHORT_INODE,
67     PER_ISCR4 =         0x0005 | STICKY_TIMEOUTS,
68     PER_BSD =           0x0006,
69     PER_SUNOS =         0x0006 | STICKY_TIMEOUTS,
70     PER_XENIX =         0x0007 | STICKY_TIMEOUTS | SHORT_INODE,
71     PER_LINUX32 =       0x0008,
72     PER_LINUX32_3GB =   0x0008 | ADDR_LIMIT_3GB,
73     PER_IRIX32 =        0x0009 | STICKY_TIMEOUTS,/* IRIX5 32-bit */
74     PER_IRIXN32 =       0x000a | STICKY_TIMEOUTS,/* IRIX6 new 32-bit */
75     PER_IRIX64 =        0x000b | STICKY_TIMEOUTS,/* IRIX6 64-bit */
76     PER_RISCOS =        0x000c,
77     PER_SOLARIS =       0x000d | STICKY_TIMEOUTS,
78     PER_UW7 =           0x000e | STICKY_TIMEOUTS | MMAP_PAGE_ZERO,
79     PER_OSF4 =          0x000f,                  /* OSF/1 v4 */
80     PER_HPUX =          0x0010,
81     PER_MASK =          0x00ff,
82 };
83
84 /*
85  * Return the base personality without flags.
86  */
87 #define personality(pers)       (pers & PER_MASK)
88
89 /* this flag is uneffective under linux too, should be deleted */
90 #ifndef MAP_DENYWRITE
91 #define MAP_DENYWRITE 0
92 #endif
93
94 /* should probably go in elf.h */
95 #ifndef ELIBBAD
96 #define ELIBBAD 80
97 #endif
98
99 #ifdef TARGET_WORDS_BIGENDIAN
100 #define ELF_DATA        ELFDATA2MSB
101 #else
102 #define ELF_DATA        ELFDATA2LSB
103 #endif
104
105 #ifdef TARGET_ABI_MIPSN32
106 typedef abi_ullong      target_elf_greg_t;
107 #define tswapreg(ptr)   tswap64(ptr)
108 #else
109 typedef abi_ulong       target_elf_greg_t;
110 #define tswapreg(ptr)   tswapal(ptr)
111 #endif
112
113 #ifdef USE_UID16
114 typedef abi_ushort      target_uid_t;
115 typedef abi_ushort      target_gid_t;
116 #else
117 typedef abi_uint        target_uid_t;
118 typedef abi_uint        target_gid_t;
119 #endif
120 typedef abi_int         target_pid_t;
121
122 #ifdef TARGET_I386
123
124 #define ELF_PLATFORM get_elf_platform()
125
126 static const char *get_elf_platform(void)
127 {
128     static char elf_platform[] = "i386";
129     int family = object_property_get_int(OBJECT(thread_cpu), "family", NULL);
130     if (family > 6)
131         family = 6;
132     if (family >= 3)
133         elf_platform[1] = '0' + family;
134     return elf_platform;
135 }
136
137 #define ELF_HWCAP get_elf_hwcap()
138
139 static uint32_t get_elf_hwcap(void)
140 {
141     X86CPU *cpu = X86_CPU(thread_cpu);
142
143     return cpu->env.features[FEAT_1_EDX];
144 }
145
146 #ifdef TARGET_X86_64
147 #define ELF_START_MMAP 0x2aaaaab000ULL
148 #define elf_check_arch(x) ( ((x) == ELF_ARCH) )
149
150 #define ELF_CLASS      ELFCLASS64
151 #define ELF_ARCH       EM_X86_64
152
153 static inline void init_thread(struct target_pt_regs *regs, struct image_info *infop)
154 {
155     regs->rax = 0;
156     regs->rsp = infop->start_stack;
157     regs->rip = infop->entry;
158 }
159
160 #define ELF_NREG    27
161 typedef target_elf_greg_t  target_elf_gregset_t[ELF_NREG];
162
163 /*
164  * Note that ELF_NREG should be 29 as there should be place for
165  * TRAPNO and ERR "registers" as well but linux doesn't dump
166  * those.
167  *
168  * See linux kernel: arch/x86/include/asm/elf.h
169  */
170 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUX86State *env)
171 {
172     (*regs)[0] = env->regs[15];
173     (*regs)[1] = env->regs[14];
174     (*regs)[2] = env->regs[13];
175     (*regs)[3] = env->regs[12];
176     (*regs)[4] = env->regs[R_EBP];
177     (*regs)[5] = env->regs[R_EBX];
178     (*regs)[6] = env->regs[11];
179     (*regs)[7] = env->regs[10];
180     (*regs)[8] = env->regs[9];
181     (*regs)[9] = env->regs[8];
182     (*regs)[10] = env->regs[R_EAX];
183     (*regs)[11] = env->regs[R_ECX];
184     (*regs)[12] = env->regs[R_EDX];
185     (*regs)[13] = env->regs[R_ESI];
186     (*regs)[14] = env->regs[R_EDI];
187     (*regs)[15] = env->regs[R_EAX]; /* XXX */
188     (*regs)[16] = env->eip;
189     (*regs)[17] = env->segs[R_CS].selector & 0xffff;
190     (*regs)[18] = env->eflags;
191     (*regs)[19] = env->regs[R_ESP];
192     (*regs)[20] = env->segs[R_SS].selector & 0xffff;
193     (*regs)[21] = env->segs[R_FS].selector & 0xffff;
194     (*regs)[22] = env->segs[R_GS].selector & 0xffff;
195     (*regs)[23] = env->segs[R_DS].selector & 0xffff;
196     (*regs)[24] = env->segs[R_ES].selector & 0xffff;
197     (*regs)[25] = env->segs[R_FS].selector & 0xffff;
198     (*regs)[26] = env->segs[R_GS].selector & 0xffff;
199 }
200
201 #else
202
203 #define ELF_START_MMAP 0x80000000
204
205 /*
206  * This is used to ensure we don't load something for the wrong architecture.
207  */
208 #define elf_check_arch(x) ( ((x) == EM_386) || ((x) == EM_486) )
209
210 /*
211  * These are used to set parameters in the core dumps.
212  */
213 #define ELF_CLASS       ELFCLASS32
214 #define ELF_ARCH        EM_386
215
216 static inline void init_thread(struct target_pt_regs *regs,
217                                struct image_info *infop)
218 {
219     regs->esp = infop->start_stack;
220     regs->eip = infop->entry;
221
222     /* SVR4/i386 ABI (pages 3-31, 3-32) says that when the program
223        starts %edx contains a pointer to a function which might be
224        registered using `atexit'.  This provides a mean for the
225        dynamic linker to call DT_FINI functions for shared libraries
226        that have been loaded before the code runs.
227
228        A value of 0 tells we have no such handler.  */
229     regs->edx = 0;
230 }
231
232 #define ELF_NREG    17
233 typedef target_elf_greg_t  target_elf_gregset_t[ELF_NREG];
234
235 /*
236  * Note that ELF_NREG should be 19 as there should be place for
237  * TRAPNO and ERR "registers" as well but linux doesn't dump
238  * those.
239  *
240  * See linux kernel: arch/x86/include/asm/elf.h
241  */
242 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUX86State *env)
243 {
244     (*regs)[0] = env->regs[R_EBX];
245     (*regs)[1] = env->regs[R_ECX];
246     (*regs)[2] = env->regs[R_EDX];
247     (*regs)[3] = env->regs[R_ESI];
248     (*regs)[4] = env->regs[R_EDI];
249     (*regs)[5] = env->regs[R_EBP];
250     (*regs)[6] = env->regs[R_EAX];
251     (*regs)[7] = env->segs[R_DS].selector & 0xffff;
252     (*regs)[8] = env->segs[R_ES].selector & 0xffff;
253     (*regs)[9] = env->segs[R_FS].selector & 0xffff;
254     (*regs)[10] = env->segs[R_GS].selector & 0xffff;
255     (*regs)[11] = env->regs[R_EAX]; /* XXX */
256     (*regs)[12] = env->eip;
257     (*regs)[13] = env->segs[R_CS].selector & 0xffff;
258     (*regs)[14] = env->eflags;
259     (*regs)[15] = env->regs[R_ESP];
260     (*regs)[16] = env->segs[R_SS].selector & 0xffff;
261 }
262 #endif
263
264 #define USE_ELF_CORE_DUMP
265 #define ELF_EXEC_PAGESIZE       4096
266
267 #endif
268
269 #ifdef TARGET_ARM
270
271 #ifndef TARGET_AARCH64
272 /* 32 bit ARM definitions */
273
274 #define ELF_START_MMAP 0x80000000
275
276 #define elf_check_arch(x) ((x) == ELF_MACHINE)
277
278 #define ELF_ARCH        ELF_MACHINE
279 #define ELF_CLASS       ELFCLASS32
280
281 static inline void init_thread(struct target_pt_regs *regs,
282                                struct image_info *infop)
283 {
284     abi_long stack = infop->start_stack;
285     memset(regs, 0, sizeof(*regs));
286
287     regs->ARM_cpsr = 0x10;
288     if (infop->entry & 1)
289         regs->ARM_cpsr |= CPSR_T;
290     regs->ARM_pc = infop->entry & 0xfffffffe;
291     regs->ARM_sp = infop->start_stack;
292     /* FIXME - what to for failure of get_user()? */
293     get_user_ual(regs->ARM_r2, stack + 8); /* envp */
294     get_user_ual(regs->ARM_r1, stack + 4); /* envp */
295     /* XXX: it seems that r0 is zeroed after ! */
296     regs->ARM_r0 = 0;
297     /* For uClinux PIC binaries.  */
298     /* XXX: Linux does this only on ARM with no MMU (do we care ?) */
299     regs->ARM_r10 = infop->start_data;
300 }
301
302 #define ELF_NREG    18
303 typedef target_elf_greg_t  target_elf_gregset_t[ELF_NREG];
304
305 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUARMState *env)
306 {
307     (*regs)[0] = tswapreg(env->regs[0]);
308     (*regs)[1] = tswapreg(env->regs[1]);
309     (*regs)[2] = tswapreg(env->regs[2]);
310     (*regs)[3] = tswapreg(env->regs[3]);
311     (*regs)[4] = tswapreg(env->regs[4]);
312     (*regs)[5] = tswapreg(env->regs[5]);
313     (*regs)[6] = tswapreg(env->regs[6]);
314     (*regs)[7] = tswapreg(env->regs[7]);
315     (*regs)[8] = tswapreg(env->regs[8]);
316     (*regs)[9] = tswapreg(env->regs[9]);
317     (*regs)[10] = tswapreg(env->regs[10]);
318     (*regs)[11] = tswapreg(env->regs[11]);
319     (*regs)[12] = tswapreg(env->regs[12]);
320     (*regs)[13] = tswapreg(env->regs[13]);
321     (*regs)[14] = tswapreg(env->regs[14]);
322     (*regs)[15] = tswapreg(env->regs[15]);
323
324     (*regs)[16] = tswapreg(cpsr_read((CPUARMState *)env));
325     (*regs)[17] = tswapreg(env->regs[0]); /* XXX */
326 }
327
328 #define USE_ELF_CORE_DUMP
329 #define ELF_EXEC_PAGESIZE       4096
330
331 enum
332 {
333     ARM_HWCAP_ARM_SWP       = 1 << 0,
334     ARM_HWCAP_ARM_HALF      = 1 << 1,
335     ARM_HWCAP_ARM_THUMB     = 1 << 2,
336     ARM_HWCAP_ARM_26BIT     = 1 << 3,
337     ARM_HWCAP_ARM_FAST_MULT = 1 << 4,
338     ARM_HWCAP_ARM_FPA       = 1 << 5,
339     ARM_HWCAP_ARM_VFP       = 1 << 6,
340     ARM_HWCAP_ARM_EDSP      = 1 << 7,
341     ARM_HWCAP_ARM_JAVA      = 1 << 8,
342     ARM_HWCAP_ARM_IWMMXT    = 1 << 9,
343     ARM_HWCAP_ARM_CRUNCH    = 1 << 10,
344     ARM_HWCAP_ARM_THUMBEE   = 1 << 11,
345     ARM_HWCAP_ARM_NEON      = 1 << 12,
346     ARM_HWCAP_ARM_VFPv3     = 1 << 13,
347     ARM_HWCAP_ARM_VFPv3D16  = 1 << 14,
348     ARM_HWCAP_ARM_TLS       = 1 << 15,
349     ARM_HWCAP_ARM_VFPv4     = 1 << 16,
350     ARM_HWCAP_ARM_IDIVA     = 1 << 17,
351     ARM_HWCAP_ARM_IDIVT     = 1 << 18,
352     ARM_HWCAP_ARM_VFPD32    = 1 << 19,
353     ARM_HWCAP_ARM_LPAE      = 1 << 20,
354     ARM_HWCAP_ARM_EVTSTRM   = 1 << 21,
355 };
356
357 enum {
358     ARM_HWCAP2_ARM_AES      = 1 << 0,
359     ARM_HWCAP2_ARM_PMULL    = 1 << 1,
360     ARM_HWCAP2_ARM_SHA1     = 1 << 2,
361     ARM_HWCAP2_ARM_SHA2     = 1 << 3,
362     ARM_HWCAP2_ARM_CRC32    = 1 << 4,
363 };
364
365 /* The commpage only exists for 32 bit kernels */
366
367 #define TARGET_HAS_VALIDATE_GUEST_SPACE
368 /* Return 1 if the proposed guest space is suitable for the guest.
369  * Return 0 if the proposed guest space isn't suitable, but another
370  * address space should be tried.
371  * Return -1 if there is no way the proposed guest space can be
372  * valid regardless of the base.
373  * The guest code may leave a page mapped and populate it if the
374  * address is suitable.
375  */
376 static int validate_guest_space(unsigned long guest_base,
377                                 unsigned long guest_size)
378 {
379     unsigned long real_start, test_page_addr;
380
381     /* We need to check that we can force a fault on access to the
382      * commpage at 0xffff0fxx
383      */
384     test_page_addr = guest_base + (0xffff0f00 & qemu_host_page_mask);
385
386     /* If the commpage lies within the already allocated guest space,
387      * then there is no way we can allocate it.
388      */
389     if (test_page_addr >= guest_base
390         && test_page_addr <= (guest_base + guest_size)) {
391         return -1;
392     }
393
394     /* Note it needs to be writeable to let us initialise it */
395     real_start = (unsigned long)
396                  mmap((void *)test_page_addr, qemu_host_page_size,
397                      PROT_READ | PROT_WRITE,
398                      MAP_ANONYMOUS | MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);
399
400     /* If we can't map it then try another address */
401     if (real_start == -1ul) {
402         return 0;
403     }
404
405     if (real_start != test_page_addr) {
406         /* OS didn't put the page where we asked - unmap and reject */
407         munmap((void *)real_start, qemu_host_page_size);
408         return 0;
409     }
410
411     /* Leave the page mapped
412      * Populate it (mmap should have left it all 0'd)
413      */
414
415     /* Kernel helper versions */
416     __put_user(5, (uint32_t *)g2h(0xffff0ffcul));
417
418     /* Now it's populated make it RO */
419     if (mprotect((void *)test_page_addr, qemu_host_page_size, PROT_READ)) {
420         perror("Protecting guest commpage");
421         exit(-1);
422     }
423
424     return 1; /* All good */
425 }
426
427 #define ELF_HWCAP get_elf_hwcap()
428 #define ELF_HWCAP2 get_elf_hwcap2()
429
430 static uint32_t get_elf_hwcap(void)
431 {
432     ARMCPU *cpu = ARM_CPU(thread_cpu);
433     uint32_t hwcaps = 0;
434
435     hwcaps |= ARM_HWCAP_ARM_SWP;
436     hwcaps |= ARM_HWCAP_ARM_HALF;
437     hwcaps |= ARM_HWCAP_ARM_THUMB;
438     hwcaps |= ARM_HWCAP_ARM_FAST_MULT;
439
440     /* probe for the extra features */
441 #define GET_FEATURE(feat, hwcap) \
442     do { if (arm_feature(&cpu->env, feat)) { hwcaps |= hwcap; } } while (0)
443     /* EDSP is in v5TE and above, but all our v5 CPUs are v5TE */
444     GET_FEATURE(ARM_FEATURE_V5, ARM_HWCAP_ARM_EDSP);
445     GET_FEATURE(ARM_FEATURE_VFP, ARM_HWCAP_ARM_VFP);
446     GET_FEATURE(ARM_FEATURE_IWMMXT, ARM_HWCAP_ARM_IWMMXT);
447     GET_FEATURE(ARM_FEATURE_THUMB2EE, ARM_HWCAP_ARM_THUMBEE);
448     GET_FEATURE(ARM_FEATURE_NEON, ARM_HWCAP_ARM_NEON);
449     GET_FEATURE(ARM_FEATURE_VFP3, ARM_HWCAP_ARM_VFPv3);
450     GET_FEATURE(ARM_FEATURE_V6K, ARM_HWCAP_ARM_TLS);
451     GET_FEATURE(ARM_FEATURE_VFP4, ARM_HWCAP_ARM_VFPv4);
452     GET_FEATURE(ARM_FEATURE_ARM_DIV, ARM_HWCAP_ARM_IDIVA);
453     GET_FEATURE(ARM_FEATURE_THUMB_DIV, ARM_HWCAP_ARM_IDIVT);
454     /* All QEMU's VFPv3 CPUs have 32 registers, see VFP_DREG in translate.c.
455      * Note that the ARM_HWCAP_ARM_VFPv3D16 bit is always the inverse of
456      * ARM_HWCAP_ARM_VFPD32 (and so always clear for QEMU); it is unrelated
457      * to our VFP_FP16 feature bit.
458      */
459     GET_FEATURE(ARM_FEATURE_VFP3, ARM_HWCAP_ARM_VFPD32);
460     GET_FEATURE(ARM_FEATURE_LPAE, ARM_HWCAP_ARM_LPAE);
461
462     return hwcaps;
463 }
464
465 static uint32_t get_elf_hwcap2(void)
466 {
467     ARMCPU *cpu = ARM_CPU(thread_cpu);
468     uint32_t hwcaps = 0;
469
470     GET_FEATURE(ARM_FEATURE_V8_AES, ARM_HWCAP2_ARM_AES);
471     GET_FEATURE(ARM_FEATURE_V8_PMULL, ARM_HWCAP2_ARM_PMULL);
472     GET_FEATURE(ARM_FEATURE_V8_SHA1, ARM_HWCAP2_ARM_SHA1);
473     GET_FEATURE(ARM_FEATURE_V8_SHA256, ARM_HWCAP2_ARM_SHA2);
474     GET_FEATURE(ARM_FEATURE_CRC, ARM_HWCAP2_ARM_CRC32);
475     return hwcaps;
476 }
477
478 #undef GET_FEATURE
479
480 #else
481 /* 64 bit ARM definitions */
482 #define ELF_START_MMAP 0x80000000
483
484 #define elf_check_arch(x) ((x) == ELF_MACHINE)
485
486 #define ELF_ARCH        ELF_MACHINE
487 #define ELF_CLASS       ELFCLASS64
488 #define ELF_PLATFORM    "aarch64"
489
490 static inline void init_thread(struct target_pt_regs *regs,
491                                struct image_info *infop)
492 {
493     abi_long stack = infop->start_stack;
494     memset(regs, 0, sizeof(*regs));
495
496     regs->pc = infop->entry & ~0x3ULL;
497     regs->sp = stack;
498 }
499
500 #define ELF_NREG    34
501 typedef target_elf_greg_t  target_elf_gregset_t[ELF_NREG];
502
503 static void elf_core_copy_regs(target_elf_gregset_t *regs,
504                                const CPUARMState *env)
505 {
506     int i;
507
508     for (i = 0; i < 32; i++) {
509         (*regs)[i] = tswapreg(env->xregs[i]);
510     }
511     (*regs)[32] = tswapreg(env->pc);
512     (*regs)[33] = tswapreg(pstate_read((CPUARMState *)env));
513 }
514
515 #define USE_ELF_CORE_DUMP
516 #define ELF_EXEC_PAGESIZE       4096
517
518 enum {
519     ARM_HWCAP_A64_FP            = 1 << 0,
520     ARM_HWCAP_A64_ASIMD         = 1 << 1,
521     ARM_HWCAP_A64_EVTSTRM       = 1 << 2,
522     ARM_HWCAP_A64_AES           = 1 << 3,
523     ARM_HWCAP_A64_PMULL         = 1 << 4,
524     ARM_HWCAP_A64_SHA1          = 1 << 5,
525     ARM_HWCAP_A64_SHA2          = 1 << 6,
526     ARM_HWCAP_A64_CRC32         = 1 << 7,
527 };
528
529 #define ELF_HWCAP get_elf_hwcap()
530
531 static uint32_t get_elf_hwcap(void)
532 {
533     ARMCPU *cpu = ARM_CPU(thread_cpu);
534     uint32_t hwcaps = 0;
535
536     hwcaps |= ARM_HWCAP_A64_FP;
537     hwcaps |= ARM_HWCAP_A64_ASIMD;
538
539     /* probe for the extra features */
540 #define GET_FEATURE(feat, hwcap) \
541     do { if (arm_feature(&cpu->env, feat)) { hwcaps |= hwcap; } } while (0)
542     GET_FEATURE(ARM_FEATURE_V8_AES, ARM_HWCAP_A64_AES);
543     GET_FEATURE(ARM_FEATURE_V8_PMULL, ARM_HWCAP_A64_PMULL);
544     GET_FEATURE(ARM_FEATURE_V8_SHA1, ARM_HWCAP_A64_SHA1);
545     GET_FEATURE(ARM_FEATURE_V8_SHA256, ARM_HWCAP_A64_SHA2);
546     GET_FEATURE(ARM_FEATURE_CRC, ARM_HWCAP_A64_CRC32);
547 #undef GET_FEATURE
548
549     return hwcaps;
550 }
551
552 #endif /* not TARGET_AARCH64 */
553 #endif /* TARGET_ARM */
554
555 #ifdef TARGET_UNICORE32
556
557 #define ELF_START_MMAP          0x80000000
558
559 #define elf_check_arch(x)       ((x) == EM_UNICORE32)
560
561 #define ELF_CLASS               ELFCLASS32
562 #define ELF_DATA                ELFDATA2LSB
563 #define ELF_ARCH                EM_UNICORE32
564
565 static inline void init_thread(struct target_pt_regs *regs,
566         struct image_info *infop)
567 {
568     abi_long stack = infop->start_stack;
569     memset(regs, 0, sizeof(*regs));
570     regs->UC32_REG_asr = 0x10;
571     regs->UC32_REG_pc = infop->entry & 0xfffffffe;
572     regs->UC32_REG_sp = infop->start_stack;
573     /* FIXME - what to for failure of get_user()? */
574     get_user_ual(regs->UC32_REG_02, stack + 8); /* envp */
575     get_user_ual(regs->UC32_REG_01, stack + 4); /* envp */
576     /* XXX: it seems that r0 is zeroed after ! */
577     regs->UC32_REG_00 = 0;
578 }
579
580 #define ELF_NREG    34
581 typedef target_elf_greg_t  target_elf_gregset_t[ELF_NREG];
582
583 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUUniCore32State *env)
584 {
585     (*regs)[0] = env->regs[0];
586     (*regs)[1] = env->regs[1];
587     (*regs)[2] = env->regs[2];
588     (*regs)[3] = env->regs[3];
589     (*regs)[4] = env->regs[4];
590     (*regs)[5] = env->regs[5];
591     (*regs)[6] = env->regs[6];
592     (*regs)[7] = env->regs[7];
593     (*regs)[8] = env->regs[8];
594     (*regs)[9] = env->regs[9];
595     (*regs)[10] = env->regs[10];
596     (*regs)[11] = env->regs[11];
597     (*regs)[12] = env->regs[12];
598     (*regs)[13] = env->regs[13];
599     (*regs)[14] = env->regs[14];
600     (*regs)[15] = env->regs[15];
601     (*regs)[16] = env->regs[16];
602     (*regs)[17] = env->regs[17];
603     (*regs)[18] = env->regs[18];
604     (*regs)[19] = env->regs[19];
605     (*regs)[20] = env->regs[20];
606     (*regs)[21] = env->regs[21];
607     (*regs)[22] = env->regs[22];
608     (*regs)[23] = env->regs[23];
609     (*regs)[24] = env->regs[24];
610     (*regs)[25] = env->regs[25];
611     (*regs)[26] = env->regs[26];
612     (*regs)[27] = env->regs[27];
613     (*regs)[28] = env->regs[28];
614     (*regs)[29] = env->regs[29];
615     (*regs)[30] = env->regs[30];
616     (*regs)[31] = env->regs[31];
617
618     (*regs)[32] = cpu_asr_read((CPUUniCore32State *)env);
619     (*regs)[33] = env->regs[0]; /* XXX */
620 }
621
622 #define USE_ELF_CORE_DUMP
623 #define ELF_EXEC_PAGESIZE               4096
624
625 #define ELF_HWCAP                       (UC32_HWCAP_CMOV | UC32_HWCAP_UCF64)
626
627 #endif
628
629 #ifdef TARGET_SPARC
630 #ifdef TARGET_SPARC64
631
632 #define ELF_START_MMAP 0x80000000
633 #define ELF_HWCAP  (HWCAP_SPARC_FLUSH | HWCAP_SPARC_STBAR | HWCAP_SPARC_SWAP \
634                     | HWCAP_SPARC_MULDIV | HWCAP_SPARC_V9)
635 #ifndef TARGET_ABI32
636 #define elf_check_arch(x) ( (x) == EM_SPARCV9 || (x) == EM_SPARC32PLUS )
637 #else
638 #define elf_check_arch(x) ( (x) == EM_SPARC32PLUS || (x) == EM_SPARC )
639 #endif
640
641 #define ELF_CLASS   ELFCLASS64
642 #define ELF_ARCH    EM_SPARCV9
643
644 #define STACK_BIAS              2047
645
646 static inline void init_thread(struct target_pt_regs *regs,
647                                struct image_info *infop)
648 {
649 #ifndef TARGET_ABI32
650     regs->tstate = 0;
651 #endif
652     regs->pc = infop->entry;
653     regs->npc = regs->pc + 4;
654     regs->y = 0;
655 #ifdef TARGET_ABI32
656     regs->u_regs[14] = infop->start_stack - 16 * 4;
657 #else
658     if (personality(infop->personality) == PER_LINUX32)
659         regs->u_regs[14] = infop->start_stack - 16 * 4;
660     else
661         regs->u_regs[14] = infop->start_stack - 16 * 8 - STACK_BIAS;
662 #endif
663 }
664
665 #else
666 #define ELF_START_MMAP 0x80000000
667 #define ELF_HWCAP  (HWCAP_SPARC_FLUSH | HWCAP_SPARC_STBAR | HWCAP_SPARC_SWAP \
668                     | HWCAP_SPARC_MULDIV)
669 #define elf_check_arch(x) ( (x) == EM_SPARC )
670
671 #define ELF_CLASS   ELFCLASS32
672 #define ELF_ARCH    EM_SPARC
673
674 static inline void init_thread(struct target_pt_regs *regs,
675                                struct image_info *infop)
676 {
677     regs->psr = 0;
678     regs->pc = infop->entry;
679     regs->npc = regs->pc + 4;
680     regs->y = 0;
681     regs->u_regs[14] = infop->start_stack - 16 * 4;
682 }
683
684 #endif
685 #endif
686
687 #ifdef TARGET_PPC
688
689 #define ELF_START_MMAP 0x80000000
690
691 #if defined(TARGET_PPC64) && !defined(TARGET_ABI32)
692
693 #define elf_check_arch(x) ( (x) == EM_PPC64 )
694
695 #define ELF_CLASS       ELFCLASS64
696
697 #else
698
699 #define elf_check_arch(x) ( (x) == EM_PPC )
700
701 #define ELF_CLASS       ELFCLASS32
702
703 #endif
704
705 #define ELF_ARCH        EM_PPC
706
707 /* Feature masks for the Aux Vector Hardware Capabilities (AT_HWCAP).
708    See arch/powerpc/include/asm/cputable.h.  */
709 enum {
710     QEMU_PPC_FEATURE_32 = 0x80000000,
711     QEMU_PPC_FEATURE_64 = 0x40000000,
712     QEMU_PPC_FEATURE_601_INSTR = 0x20000000,
713     QEMU_PPC_FEATURE_HAS_ALTIVEC = 0x10000000,
714     QEMU_PPC_FEATURE_HAS_FPU = 0x08000000,
715     QEMU_PPC_FEATURE_HAS_MMU = 0x04000000,
716     QEMU_PPC_FEATURE_HAS_4xxMAC = 0x02000000,
717     QEMU_PPC_FEATURE_UNIFIED_CACHE = 0x01000000,
718     QEMU_PPC_FEATURE_HAS_SPE = 0x00800000,
719     QEMU_PPC_FEATURE_HAS_EFP_SINGLE = 0x00400000,
720     QEMU_PPC_FEATURE_HAS_EFP_DOUBLE = 0x00200000,
721     QEMU_PPC_FEATURE_NO_TB = 0x00100000,
722     QEMU_PPC_FEATURE_POWER4 = 0x00080000,
723     QEMU_PPC_FEATURE_POWER5 = 0x00040000,
724     QEMU_PPC_FEATURE_POWER5_PLUS = 0x00020000,
725     QEMU_PPC_FEATURE_CELL = 0x00010000,
726     QEMU_PPC_FEATURE_BOOKE = 0x00008000,
727     QEMU_PPC_FEATURE_SMT = 0x00004000,
728     QEMU_PPC_FEATURE_ICACHE_SNOOP = 0x00002000,
729     QEMU_PPC_FEATURE_ARCH_2_05 = 0x00001000,
730     QEMU_PPC_FEATURE_PA6T = 0x00000800,
731     QEMU_PPC_FEATURE_HAS_DFP = 0x00000400,
732     QEMU_PPC_FEATURE_POWER6_EXT = 0x00000200,
733     QEMU_PPC_FEATURE_ARCH_2_06 = 0x00000100,
734     QEMU_PPC_FEATURE_HAS_VSX = 0x00000080,
735     QEMU_PPC_FEATURE_PSERIES_PERFMON_COMPAT = 0x00000040,
736
737     QEMU_PPC_FEATURE_TRUE_LE = 0x00000002,
738     QEMU_PPC_FEATURE_PPC_LE = 0x00000001,
739
740     /* Feature definitions in AT_HWCAP2.  */
741     QEMU_PPC_FEATURE2_ARCH_2_07 = 0x80000000, /* ISA 2.07 */
742     QEMU_PPC_FEATURE2_HAS_HTM = 0x40000000, /* Hardware Transactional Memory */
743     QEMU_PPC_FEATURE2_HAS_DSCR = 0x20000000, /* Data Stream Control Register */
744     QEMU_PPC_FEATURE2_HAS_EBB = 0x10000000, /* Event Base Branching */
745     QEMU_PPC_FEATURE2_HAS_ISEL = 0x08000000, /* Integer Select */
746     QEMU_PPC_FEATURE2_HAS_TAR = 0x04000000, /* Target Address Register */
747 };
748
749 #define ELF_HWCAP get_elf_hwcap()
750
751 static uint32_t get_elf_hwcap(void)
752 {
753     PowerPCCPU *cpu = POWERPC_CPU(thread_cpu);
754     uint32_t features = 0;
755
756     /* We don't have to be terribly complete here; the high points are
757        Altivec/FP/SPE support.  Anything else is just a bonus.  */
758 #define GET_FEATURE(flag, feature)                                      \
759     do { if (cpu->env.insns_flags & flag) { features |= feature; } } while (0)
760 #define GET_FEATURE2(flag, feature)                                      \
761     do { if (cpu->env.insns_flags2 & flag) { features |= feature; } } while (0)
762     GET_FEATURE(PPC_64B, QEMU_PPC_FEATURE_64);
763     GET_FEATURE(PPC_FLOAT, QEMU_PPC_FEATURE_HAS_FPU);
764     GET_FEATURE(PPC_ALTIVEC, QEMU_PPC_FEATURE_HAS_ALTIVEC);
765     GET_FEATURE(PPC_SPE, QEMU_PPC_FEATURE_HAS_SPE);
766     GET_FEATURE(PPC_SPE_SINGLE, QEMU_PPC_FEATURE_HAS_EFP_SINGLE);
767     GET_FEATURE(PPC_SPE_DOUBLE, QEMU_PPC_FEATURE_HAS_EFP_DOUBLE);
768     GET_FEATURE(PPC_BOOKE, QEMU_PPC_FEATURE_BOOKE);
769     GET_FEATURE(PPC_405_MAC, QEMU_PPC_FEATURE_HAS_4xxMAC);
770     GET_FEATURE2(PPC2_DFP, QEMU_PPC_FEATURE_HAS_DFP);
771     GET_FEATURE2(PPC2_VSX, QEMU_PPC_FEATURE_HAS_VSX);
772     GET_FEATURE2((PPC2_PERM_ISA206 | PPC2_DIVE_ISA206 | PPC2_ATOMIC_ISA206 |
773                   PPC2_FP_CVT_ISA206 | PPC2_FP_TST_ISA206),
774                   QEMU_PPC_FEATURE_ARCH_2_06);
775 #undef GET_FEATURE
776 #undef GET_FEATURE2
777
778     return features;
779 }
780
781 #define ELF_HWCAP2 get_elf_hwcap2()
782
783 static uint32_t get_elf_hwcap2(void)
784 {
785     PowerPCCPU *cpu = POWERPC_CPU(thread_cpu);
786     uint32_t features = 0;
787
788 #define GET_FEATURE(flag, feature)                                      \
789     do { if (cpu->env.insns_flags & flag) { features |= feature; } } while (0)
790 #define GET_FEATURE2(flag, feature)                                      \
791     do { if (cpu->env.insns_flags2 & flag) { features |= feature; } } while (0)
792
793     GET_FEATURE(PPC_ISEL, QEMU_PPC_FEATURE2_HAS_ISEL);
794     GET_FEATURE2(PPC2_BCTAR_ISA207, QEMU_PPC_FEATURE2_HAS_TAR);
795     GET_FEATURE2((PPC2_BCTAR_ISA207 | PPC2_LSQ_ISA207 | PPC2_ALTIVEC_207 |
796                   PPC2_ISA207S), QEMU_PPC_FEATURE2_ARCH_2_07);
797
798 #undef GET_FEATURE
799 #undef GET_FEATURE2
800
801     return features;
802 }
803
804 /*
805  * The requirements here are:
806  * - keep the final alignment of sp (sp & 0xf)
807  * - make sure the 32-bit value at the first 16 byte aligned position of
808  *   AUXV is greater than 16 for glibc compatibility.
809  *   AT_IGNOREPPC is used for that.
810  * - for compatibility with glibc ARCH_DLINFO must always be defined on PPC,
811  *   even if DLINFO_ARCH_ITEMS goes to zero or is undefined.
812  */
813 #define DLINFO_ARCH_ITEMS       5
814 #define ARCH_DLINFO                                     \
815     do {                                                \
816         PowerPCCPU *cpu = POWERPC_CPU(thread_cpu);              \
817         NEW_AUX_ENT(AT_DCACHEBSIZE, cpu->env.dcache_line_size); \
818         NEW_AUX_ENT(AT_ICACHEBSIZE, cpu->env.icache_line_size); \
819         NEW_AUX_ENT(AT_UCACHEBSIZE, 0);                 \
820         /*                                              \
821          * Now handle glibc compatibility.              \
822          */                                             \
823         NEW_AUX_ENT(AT_IGNOREPPC, AT_IGNOREPPC);        \
824         NEW_AUX_ENT(AT_IGNOREPPC, AT_IGNOREPPC);        \
825     } while (0)
826
827 static inline void init_thread(struct target_pt_regs *_regs, struct image_info *infop)
828 {
829     _regs->gpr[1] = infop->start_stack;
830 #if defined(TARGET_PPC64) && !defined(TARGET_ABI32)
831     if (get_ppc64_abi(infop) < 2) {
832         uint64_t val;
833         get_user_u64(val, infop->entry + 8);
834         _regs->gpr[2] = val + infop->load_bias;
835         get_user_u64(val, infop->entry);
836         infop->entry = val + infop->load_bias;
837     } else {
838         _regs->gpr[12] = infop->entry;  /* r12 set to global entry address */
839     }
840 #endif
841     _regs->nip = infop->entry;
842 }
843
844 /* See linux kernel: arch/powerpc/include/asm/elf.h.  */
845 #define ELF_NREG 48
846 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
847
848 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUPPCState *env)
849 {
850     int i;
851     target_ulong ccr = 0;
852
853     for (i = 0; i < ARRAY_SIZE(env->gpr); i++) {
854         (*regs)[i] = tswapreg(env->gpr[i]);
855     }
856
857     (*regs)[32] = tswapreg(env->nip);
858     (*regs)[33] = tswapreg(env->msr);
859     (*regs)[35] = tswapreg(env->ctr);
860     (*regs)[36] = tswapreg(env->lr);
861     (*regs)[37] = tswapreg(env->xer);
862
863     for (i = 0; i < ARRAY_SIZE(env->crf); i++) {
864         ccr |= env->crf[i] << (32 - ((i + 1) * 4));
865     }
866     (*regs)[38] = tswapreg(ccr);
867 }
868
869 #define USE_ELF_CORE_DUMP
870 #define ELF_EXEC_PAGESIZE       4096
871
872 #endif
873
874 #ifdef TARGET_MIPS
875
876 #define ELF_START_MMAP 0x80000000
877
878 #define elf_check_arch(x) ( (x) == EM_MIPS )
879
880 #ifdef TARGET_MIPS64
881 #define ELF_CLASS   ELFCLASS64
882 #else
883 #define ELF_CLASS   ELFCLASS32
884 #endif
885 #define ELF_ARCH    EM_MIPS
886
887 static inline void init_thread(struct target_pt_regs *regs,
888                                struct image_info *infop)
889 {
890     regs->cp0_status = 2 << CP0St_KSU;
891     regs->cp0_epc = infop->entry;
892     regs->regs[29] = infop->start_stack;
893 }
894
895 /* See linux kernel: arch/mips/include/asm/elf.h.  */
896 #define ELF_NREG 45
897 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
898
899 /* See linux kernel: arch/mips/include/asm/reg.h.  */
900 enum {
901 #ifdef TARGET_MIPS64
902     TARGET_EF_R0 = 0,
903 #else
904     TARGET_EF_R0 = 6,
905 #endif
906     TARGET_EF_R26 = TARGET_EF_R0 + 26,
907     TARGET_EF_R27 = TARGET_EF_R0 + 27,
908     TARGET_EF_LO = TARGET_EF_R0 + 32,
909     TARGET_EF_HI = TARGET_EF_R0 + 33,
910     TARGET_EF_CP0_EPC = TARGET_EF_R0 + 34,
911     TARGET_EF_CP0_BADVADDR = TARGET_EF_R0 + 35,
912     TARGET_EF_CP0_STATUS = TARGET_EF_R0 + 36,
913     TARGET_EF_CP0_CAUSE = TARGET_EF_R0 + 37
914 };
915
916 /* See linux kernel: arch/mips/kernel/process.c:elf_dump_regs.  */
917 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUMIPSState *env)
918 {
919     int i;
920
921     for (i = 0; i < TARGET_EF_R0; i++) {
922         (*regs)[i] = 0;
923     }
924     (*regs)[TARGET_EF_R0] = 0;
925
926     for (i = 1; i < ARRAY_SIZE(env->active_tc.gpr); i++) {
927         (*regs)[TARGET_EF_R0 + i] = tswapreg(env->active_tc.gpr[i]);
928     }
929
930     (*regs)[TARGET_EF_R26] = 0;
931     (*regs)[TARGET_EF_R27] = 0;
932     (*regs)[TARGET_EF_LO] = tswapreg(env->active_tc.LO[0]);
933     (*regs)[TARGET_EF_HI] = tswapreg(env->active_tc.HI[0]);
934     (*regs)[TARGET_EF_CP0_EPC] = tswapreg(env->active_tc.PC);
935     (*regs)[TARGET_EF_CP0_BADVADDR] = tswapreg(env->CP0_BadVAddr);
936     (*regs)[TARGET_EF_CP0_STATUS] = tswapreg(env->CP0_Status);
937     (*regs)[TARGET_EF_CP0_CAUSE] = tswapreg(env->CP0_Cause);
938 }
939
940 #define USE_ELF_CORE_DUMP
941 #define ELF_EXEC_PAGESIZE        4096
942
943 #endif /* TARGET_MIPS */
944
945 #ifdef TARGET_MICROBLAZE
946
947 #define ELF_START_MMAP 0x80000000
948
949 #define elf_check_arch(x) ( (x) == EM_MICROBLAZE || (x) == EM_MICROBLAZE_OLD)
950
951 #define ELF_CLASS   ELFCLASS32
952 #define ELF_ARCH    EM_MICROBLAZE
953
954 static inline void init_thread(struct target_pt_regs *regs,
955                                struct image_info *infop)
956 {
957     regs->pc = infop->entry;
958     regs->r1 = infop->start_stack;
959
960 }
961
962 #define ELF_EXEC_PAGESIZE        4096
963
964 #define USE_ELF_CORE_DUMP
965 #define ELF_NREG 38
966 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
967
968 /* See linux kernel: arch/mips/kernel/process.c:elf_dump_regs.  */
969 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUMBState *env)
970 {
971     int i, pos = 0;
972
973     for (i = 0; i < 32; i++) {
974         (*regs)[pos++] = tswapreg(env->regs[i]);
975     }
976
977     for (i = 0; i < 6; i++) {
978         (*regs)[pos++] = tswapreg(env->sregs[i]);
979     }
980 }
981
982 #endif /* TARGET_MICROBLAZE */
983
984 #ifdef TARGET_OPENRISC
985
986 #define ELF_START_MMAP 0x08000000
987
988 #define elf_check_arch(x) ((x) == EM_OPENRISC)
989
990 #define ELF_ARCH EM_OPENRISC
991 #define ELF_CLASS ELFCLASS32
992 #define ELF_DATA  ELFDATA2MSB
993
994 static inline void init_thread(struct target_pt_regs *regs,
995                                struct image_info *infop)
996 {
997     regs->pc = infop->entry;
998     regs->gpr[1] = infop->start_stack;
999 }
1000
1001 #define USE_ELF_CORE_DUMP
1002 #define ELF_EXEC_PAGESIZE 8192
1003
1004 /* See linux kernel arch/openrisc/include/asm/elf.h.  */
1005 #define ELF_NREG 34 /* gprs and pc, sr */
1006 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
1007
1008 static void elf_core_copy_regs(target_elf_gregset_t *regs,
1009                                const CPUOpenRISCState *env)
1010 {
1011     int i;
1012
1013     for (i = 0; i < 32; i++) {
1014         (*regs)[i] = tswapreg(env->gpr[i]);
1015     }
1016
1017     (*regs)[32] = tswapreg(env->pc);
1018     (*regs)[33] = tswapreg(env->sr);
1019 }
1020 #define ELF_HWCAP 0
1021 #define ELF_PLATFORM NULL
1022
1023 #endif /* TARGET_OPENRISC */
1024
1025 #ifdef TARGET_SH4
1026
1027 #define ELF_START_MMAP 0x80000000
1028
1029 #define elf_check_arch(x) ( (x) == EM_SH )
1030
1031 #define ELF_CLASS ELFCLASS32
1032 #define ELF_ARCH  EM_SH
1033
1034 static inline void init_thread(struct target_pt_regs *regs,
1035                                struct image_info *infop)
1036 {
1037     /* Check other registers XXXXX */
1038     regs->pc = infop->entry;
1039     regs->regs[15] = infop->start_stack;
1040 }
1041
1042 /* See linux kernel: arch/sh/include/asm/elf.h.  */
1043 #define ELF_NREG 23
1044 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
1045
1046 /* See linux kernel: arch/sh/include/asm/ptrace.h.  */
1047 enum {
1048     TARGET_REG_PC = 16,
1049     TARGET_REG_PR = 17,
1050     TARGET_REG_SR = 18,
1051     TARGET_REG_GBR = 19,
1052     TARGET_REG_MACH = 20,
1053     TARGET_REG_MACL = 21,
1054     TARGET_REG_SYSCALL = 22
1055 };
1056
1057 static inline void elf_core_copy_regs(target_elf_gregset_t *regs,
1058                                       const CPUSH4State *env)
1059 {
1060     int i;
1061
1062     for (i = 0; i < 16; i++) {
1063         (*regs[i]) = tswapreg(env->gregs[i]);
1064     }
1065
1066     (*regs)[TARGET_REG_PC] = tswapreg(env->pc);
1067     (*regs)[TARGET_REG_PR] = tswapreg(env->pr);
1068     (*regs)[TARGET_REG_SR] = tswapreg(env->sr);
1069     (*regs)[TARGET_REG_GBR] = tswapreg(env->gbr);
1070     (*regs)[TARGET_REG_MACH] = tswapreg(env->mach);
1071     (*regs)[TARGET_REG_MACL] = tswapreg(env->macl);
1072     (*regs)[TARGET_REG_SYSCALL] = 0; /* FIXME */
1073 }
1074
1075 #define USE_ELF_CORE_DUMP
1076 #define ELF_EXEC_PAGESIZE        4096
1077
1078 enum {
1079     SH_CPU_HAS_FPU            = 0x0001, /* Hardware FPU support */
1080     SH_CPU_HAS_P2_FLUSH_BUG   = 0x0002, /* Need to flush the cache in P2 area */
1081     SH_CPU_HAS_MMU_PAGE_ASSOC = 0x0004, /* SH3: TLB way selection bit support */
1082     SH_CPU_HAS_DSP            = 0x0008, /* SH-DSP: DSP support */
1083     SH_CPU_HAS_PERF_COUNTER   = 0x0010, /* Hardware performance counters */
1084     SH_CPU_HAS_PTEA           = 0x0020, /* PTEA register */
1085     SH_CPU_HAS_LLSC           = 0x0040, /* movli.l/movco.l */
1086     SH_CPU_HAS_L2_CACHE       = 0x0080, /* Secondary cache / URAM */
1087     SH_CPU_HAS_OP32           = 0x0100, /* 32-bit instruction support */
1088     SH_CPU_HAS_PTEAEX         = 0x0200, /* PTE ASID Extension support */
1089 };
1090
1091 #define ELF_HWCAP get_elf_hwcap()
1092
1093 static uint32_t get_elf_hwcap(void)
1094 {
1095     SuperHCPU *cpu = SUPERH_CPU(thread_cpu);
1096     uint32_t hwcap = 0;
1097
1098     hwcap |= SH_CPU_HAS_FPU;
1099
1100     if (cpu->env.features & SH_FEATURE_SH4A) {
1101         hwcap |= SH_CPU_HAS_LLSC;
1102     }
1103
1104     return hwcap;
1105 }
1106
1107 #endif
1108
1109 #ifdef TARGET_CRIS
1110
1111 #define ELF_START_MMAP 0x80000000
1112
1113 #define elf_check_arch(x) ( (x) == EM_CRIS )
1114
1115 #define ELF_CLASS ELFCLASS32
1116 #define ELF_ARCH  EM_CRIS
1117
1118 static inline void init_thread(struct target_pt_regs *regs,
1119                                struct image_info *infop)
1120 {
1121     regs->erp = infop->entry;
1122 }
1123
1124 #define ELF_EXEC_PAGESIZE        8192
1125
1126 #endif
1127
1128 #ifdef TARGET_M68K
1129
1130 #define ELF_START_MMAP 0x80000000
1131
1132 #define elf_check_arch(x) ( (x) == EM_68K )
1133
1134 #define ELF_CLASS       ELFCLASS32
1135 #define ELF_ARCH        EM_68K
1136
1137 /* ??? Does this need to do anything?
1138    #define ELF_PLAT_INIT(_r) */
1139
1140 static inline void init_thread(struct target_pt_regs *regs,
1141                                struct image_info *infop)
1142 {
1143     regs->usp = infop->start_stack;
1144     regs->sr = 0;
1145     regs->pc = infop->entry;
1146 }
1147
1148 /* See linux kernel: arch/m68k/include/asm/elf.h.  */
1149 #define ELF_NREG 20
1150 typedef target_elf_greg_t target_elf_gregset_t[ELF_NREG];
1151
1152 static void elf_core_copy_regs(target_elf_gregset_t *regs, const CPUM68KState *env)
1153 {
1154     (*regs)[0] = tswapreg(env->dregs[1]);
1155     (*regs)[1] = tswapreg(env->dregs[2]);
1156     (*regs)[2] = tswapreg(env->dregs[3]);
1157     (*regs)[3] = tswapreg(env->dregs[4]);
1158     (*regs)[4] = tswapreg(env->dregs[5]);
1159     (*regs)[5] = tswapreg(env->dregs[6]);
1160     (*regs)[6] = tswapreg(env->dregs[7]);
1161     (*regs)[7] = tswapreg(env->aregs[0]);
1162     (*regs)[8] = tswapreg(env->aregs[1]);
1163     (*regs)[9] = tswapreg(env->aregs[2]);
1164     (*regs)[10] = tswapreg(env->aregs[3]);
1165     (*regs)[11] = tswapreg(env->aregs[4]);
1166     (*regs)[12] = tswapreg(env->aregs[5]);
1167     (*regs)[13] = tswapreg(env->aregs[6]);
1168     (*regs)[14] = tswapreg(env->dregs[0]);
1169     (*regs)[15] = tswapreg(env->aregs[7]);
1170     (*regs)[16] = tswapreg(env->dregs[0]); /* FIXME: orig_d0 */
1171     (*regs)[17] = tswapreg(env->sr);
1172     (*regs)[18] = tswapreg(env->pc);
1173     (*regs)[19] = 0;  /* FIXME: regs->format | regs->vector */
1174 }
1175
1176 #define USE_ELF_CORE_DUMP
1177 #define ELF_EXEC_PAGESIZE       8192
1178
1179 #endif
1180
1181 #ifdef TARGET_ALPHA
1182
1183 #define ELF_START_MMAP (0x30000000000ULL)
1184
1185 #define elf_check_arch(x) ( (x) == ELF_ARCH )
1186
1187 #define ELF_CLASS      ELFCLASS64
1188 #define ELF_ARCH       EM_ALPHA
1189
1190 static inline void init_thread(struct target_pt_regs *regs,
1191                                struct image_info *infop)
1192 {
1193     regs->pc = infop->entry;
1194     regs->ps = 8;
1195     regs->usp = infop->start_stack;
1196 }
1197
1198 #define ELF_EXEC_PAGESIZE        8192
1199
1200 #endif /* TARGET_ALPHA */
1201
1202 #ifdef TARGET_S390X
1203
1204 #define ELF_START_MMAP (0x20000000000ULL)
1205
1206 #define elf_check_arch(x) ( (x) == ELF_ARCH )
1207
1208 #define ELF_CLASS       ELFCLASS64
1209 #define ELF_DATA        ELFDATA2MSB
1210 #define ELF_ARCH        EM_S390
1211
1212 static inline void init_thread(struct target_pt_regs *regs, struct image_info *infop)
1213 {
1214     regs->psw.addr = infop->entry;
1215     regs->psw.mask = PSW_MASK_64 | PSW_MASK_32;
1216     regs->gprs[15] = infop->start_stack;
1217 }
1218
1219 #endif /* TARGET_S390X */
1220
1221 #ifndef ELF_PLATFORM
1222 #define ELF_PLATFORM (NULL)
1223 #endif
1224
1225 #ifndef ELF_HWCAP
1226 #define ELF_HWCAP 0
1227 #endif
1228
1229 #ifdef TARGET_ABI32
1230 #undef ELF_CLASS
1231 #define ELF_CLASS ELFCLASS32
1232 #undef bswaptls
1233 #define bswaptls(ptr) bswap32s(ptr)
1234 #endif
1235
1236 #include "elf.h"
1237
1238 struct exec
1239 {
1240     unsigned int a_info;   /* Use macros N_MAGIC, etc for access */
1241     unsigned int a_text;   /* length of text, in bytes */
1242     unsigned int a_data;   /* length of data, in bytes */
1243     unsigned int a_bss;    /* length of uninitialized data area, in bytes */
1244     unsigned int a_syms;   /* length of symbol table data in file, in bytes */
1245     unsigned int a_entry;  /* start address */
1246     unsigned int a_trsize; /* length of relocation info for text, in bytes */
1247     unsigned int a_drsize; /* length of relocation info for data, in bytes */
1248 };
1249
1250
1251 #define N_MAGIC(exec) ((exec).a_info & 0xffff)
1252 #define OMAGIC 0407
1253 #define NMAGIC 0410
1254 #define ZMAGIC 0413
1255 #define QMAGIC 0314
1256
1257 /* Necessary parameters */
1258 #define TARGET_ELF_EXEC_PAGESIZE TARGET_PAGE_SIZE
1259 #define TARGET_ELF_PAGESTART(_v) ((_v) & \
1260                                  ~(abi_ulong)(TARGET_ELF_EXEC_PAGESIZE-1))
1261 #define TARGET_ELF_PAGEOFFSET(_v) ((_v) & (TARGET_ELF_EXEC_PAGESIZE-1))
1262
1263 #define DLINFO_ITEMS 14
1264
1265 static inline void memcpy_fromfs(void * to, const void * from, unsigned long n)
1266 {
1267     memcpy(to, from, n);
1268 }
1269
1270 #ifdef BSWAP_NEEDED
1271 static void bswap_ehdr(struct elfhdr *ehdr)
1272 {
1273     bswap16s(&ehdr->e_type);            /* Object file type */
1274     bswap16s(&ehdr->e_machine);         /* Architecture */
1275     bswap32s(&ehdr->e_version);         /* Object file version */
1276     bswaptls(&ehdr->e_entry);           /* Entry point virtual address */
1277     bswaptls(&ehdr->e_phoff);           /* Program header table file offset */
1278     bswaptls(&ehdr->e_shoff);           /* Section header table file offset */
1279     bswap32s(&ehdr->e_flags);           /* Processor-specific flags */
1280     bswap16s(&ehdr->e_ehsize);          /* ELF header size in bytes */
1281     bswap16s(&ehdr->e_phentsize);       /* Program header table entry size */
1282     bswap16s(&ehdr->e_phnum);           /* Program header table entry count */
1283     bswap16s(&ehdr->e_shentsize);       /* Section header table entry size */
1284     bswap16s(&ehdr->e_shnum);           /* Section header table entry count */
1285     bswap16s(&ehdr->e_shstrndx);        /* Section header string table index */
1286 }
1287
1288 static void bswap_phdr(struct elf_phdr *phdr, int phnum)
1289 {
1290     int i;
1291     for (i = 0; i < phnum; ++i, ++phdr) {
1292         bswap32s(&phdr->p_type);        /* Segment type */
1293         bswap32s(&phdr->p_flags);       /* Segment flags */
1294         bswaptls(&phdr->p_offset);      /* Segment file offset */
1295         bswaptls(&phdr->p_vaddr);       /* Segment virtual address */
1296         bswaptls(&phdr->p_paddr);       /* Segment physical address */
1297         bswaptls(&phdr->p_filesz);      /* Segment size in file */
1298         bswaptls(&phdr->p_memsz);       /* Segment size in memory */
1299         bswaptls(&phdr->p_align);       /* Segment alignment */
1300     }
1301 }
1302
1303 static void bswap_shdr(struct elf_shdr *shdr, int shnum)
1304 {
1305     int i;
1306     for (i = 0; i < shnum; ++i, ++shdr) {
1307         bswap32s(&shdr->sh_name);
1308         bswap32s(&shdr->sh_type);
1309         bswaptls(&shdr->sh_flags);
1310         bswaptls(&shdr->sh_addr);
1311         bswaptls(&shdr->sh_offset);
1312         bswaptls(&shdr->sh_size);
1313         bswap32s(&shdr->sh_link);
1314         bswap32s(&shdr->sh_info);
1315         bswaptls(&shdr->sh_addralign);
1316         bswaptls(&shdr->sh_entsize);
1317     }
1318 }
1319
1320 static void bswap_sym(struct elf_sym *sym)
1321 {
1322     bswap32s(&sym->st_name);
1323     bswaptls(&sym->st_value);
1324     bswaptls(&sym->st_size);
1325     bswap16s(&sym->st_shndx);
1326 }
1327 #else
1328 static inline void bswap_ehdr(struct elfhdr *ehdr) { }
1329 static inline void bswap_phdr(struct elf_phdr *phdr, int phnum) { }
1330 static inline void bswap_shdr(struct elf_shdr *shdr, int shnum) { }
1331 static inline void bswap_sym(struct elf_sym *sym) { }
1332 #endif
1333
1334 #ifdef USE_ELF_CORE_DUMP
1335 static int elf_core_dump(int, const CPUArchState *);
1336 #endif /* USE_ELF_CORE_DUMP */
1337 static void load_symbols(struct elfhdr *hdr, int fd, abi_ulong load_bias);
1338
1339 /* Verify the portions of EHDR within E_IDENT for the target.
1340    This can be performed before bswapping the entire header.  */
1341 static bool elf_check_ident(struct elfhdr *ehdr)
1342 {
1343     return (ehdr->e_ident[EI_MAG0] == ELFMAG0
1344             && ehdr->e_ident[EI_MAG1] == ELFMAG1
1345             && ehdr->e_ident[EI_MAG2] == ELFMAG2
1346             && ehdr->e_ident[EI_MAG3] == ELFMAG3
1347             && ehdr->e_ident[EI_CLASS] == ELF_CLASS
1348             && ehdr->e_ident[EI_DATA] == ELF_DATA
1349             && ehdr->e_ident[EI_VERSION] == EV_CURRENT);
1350 }
1351
1352 /* Verify the portions of EHDR outside of E_IDENT for the target.
1353    This has to wait until after bswapping the header.  */
1354 static bool elf_check_ehdr(struct elfhdr *ehdr)
1355 {
1356     return (elf_check_arch(ehdr->e_machine)
1357             && ehdr->e_ehsize == sizeof(struct elfhdr)
1358             && ehdr->e_phentsize == sizeof(struct elf_phdr)
1359             && (ehdr->e_type == ET_EXEC || ehdr->e_type == ET_DYN));
1360 }
1361
1362 /*
1363  * 'copy_elf_strings()' copies argument/envelope strings from user
1364  * memory to free pages in kernel mem. These are in a format ready
1365  * to be put directly into the top of new user memory.
1366  *
1367  */
1368 static abi_ulong copy_elf_strings(int argc,char ** argv, void **page,
1369                                   abi_ulong p)
1370 {
1371     char *tmp, *tmp1, *pag = NULL;
1372     int len, offset = 0;
1373
1374     if (!p) {
1375         return 0;       /* bullet-proofing */
1376     }
1377     while (argc-- > 0) {
1378         tmp = argv[argc];
1379         if (!tmp) {
1380             fprintf(stderr, "VFS: argc is wrong");
1381             exit(-1);
1382         }
1383         tmp1 = tmp;
1384         while (*tmp++);
1385         len = tmp - tmp1;
1386         if (p < len) {  /* this shouldn't happen - 128kB */
1387             return 0;
1388         }
1389         while (len) {
1390             --p; --tmp; --len;
1391             if (--offset < 0) {
1392                 offset = p % TARGET_PAGE_SIZE;
1393                 pag = (char *)page[p/TARGET_PAGE_SIZE];
1394                 if (!pag) {
1395                     pag = g_try_malloc0(TARGET_PAGE_SIZE);
1396                     page[p/TARGET_PAGE_SIZE] = pag;
1397                     if (!pag)
1398                         return 0;
1399                 }
1400             }
1401             if (len == 0 || offset == 0) {
1402                 *(pag + offset) = *tmp;
1403             }
1404             else {
1405                 int bytes_to_copy = (len > offset) ? offset : len;
1406                 tmp -= bytes_to_copy;
1407                 p -= bytes_to_copy;
1408                 offset -= bytes_to_copy;
1409                 len -= bytes_to_copy;
1410                 memcpy_fromfs(pag + offset, tmp, bytes_to_copy + 1);
1411             }
1412         }
1413     }
1414     return p;
1415 }
1416
1417 static abi_ulong setup_arg_pages(abi_ulong p, struct linux_binprm *bprm,
1418                                  struct image_info *info)
1419 {
1420     abi_ulong stack_base, size, error, guard;
1421     int i;
1422
1423     /* Create enough stack to hold everything.  If we don't use
1424        it for args, we'll use it for something else.  */
1425     size = guest_stack_size;
1426     if (size < MAX_ARG_PAGES*TARGET_PAGE_SIZE) {
1427         size = MAX_ARG_PAGES*TARGET_PAGE_SIZE;
1428     }
1429     guard = TARGET_PAGE_SIZE;
1430     if (guard < qemu_real_host_page_size) {
1431         guard = qemu_real_host_page_size;
1432     }
1433
1434     error = target_mmap(0, size + guard, PROT_READ | PROT_WRITE,
1435                         MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);
1436     if (error == -1) {
1437         perror("mmap stack");
1438         exit(-1);
1439     }
1440
1441     /* We reserve one extra page at the top of the stack as guard.  */
1442     target_mprotect(error, guard, PROT_NONE);
1443
1444     info->stack_limit = error + guard;
1445     stack_base = info->stack_limit + size - MAX_ARG_PAGES*TARGET_PAGE_SIZE;
1446     p += stack_base;
1447
1448     for (i = 0 ; i < MAX_ARG_PAGES ; i++) {
1449         if (bprm->page[i]) {
1450             info->rss++;
1451             /* FIXME - check return value of memcpy_to_target() for failure */
1452             memcpy_to_target(stack_base, bprm->page[i], TARGET_PAGE_SIZE);
1453             g_free(bprm->page[i]);
1454         }
1455         stack_base += TARGET_PAGE_SIZE;
1456     }
1457     return p;
1458 }
1459
1460 /* Map and zero the bss.  We need to explicitly zero any fractional pages
1461    after the data section (i.e. bss).  */
1462 static void zero_bss(abi_ulong elf_bss, abi_ulong last_bss, int prot)
1463 {
1464     uintptr_t host_start, host_map_start, host_end;
1465
1466     last_bss = TARGET_PAGE_ALIGN(last_bss);
1467
1468     /* ??? There is confusion between qemu_real_host_page_size and
1469        qemu_host_page_size here and elsewhere in target_mmap, which
1470        may lead to the end of the data section mapping from the file
1471        not being mapped.  At least there was an explicit test and
1472        comment for that here, suggesting that "the file size must
1473        be known".  The comment probably pre-dates the introduction
1474        of the fstat system call in target_mmap which does in fact
1475        find out the size.  What isn't clear is if the workaround
1476        here is still actually needed.  For now, continue with it,
1477        but merge it with the "normal" mmap that would allocate the bss.  */
1478
1479     host_start = (uintptr_t) g2h(elf_bss);
1480     host_end = (uintptr_t) g2h(last_bss);
1481     host_map_start = (host_start + qemu_real_host_page_size - 1);
1482     host_map_start &= -qemu_real_host_page_size;
1483
1484     if (host_map_start < host_end) {
1485         void *p = mmap((void *)host_map_start, host_end - host_map_start,
1486                        prot, MAP_FIXED | MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);
1487         if (p == MAP_FAILED) {
1488             perror("cannot mmap brk");
1489             exit(-1);
1490         }
1491     }
1492
1493     /* Ensure that the bss page(s) are valid */
1494     if ((page_get_flags(last_bss-1) & prot) != prot) {
1495         page_set_flags(elf_bss & TARGET_PAGE_MASK, last_bss, prot | PAGE_VALID);
1496     }
1497
1498     if (host_start < host_map_start) {
1499         memset((void *)host_start, 0, host_map_start - host_start);
1500     }
1501 }
1502
1503 #ifdef CONFIG_USE_FDPIC
1504 static abi_ulong loader_build_fdpic_loadmap(struct image_info *info, abi_ulong sp)
1505 {
1506     uint16_t n;
1507     struct elf32_fdpic_loadseg *loadsegs = info->loadsegs;
1508
1509     /* elf32_fdpic_loadseg */
1510     n = info->nsegs;
1511     while (n--) {
1512         sp -= 12;
1513         put_user_u32(loadsegs[n].addr, sp+0);
1514         put_user_u32(loadsegs[n].p_vaddr, sp+4);
1515         put_user_u32(loadsegs[n].p_memsz, sp+8);
1516     }
1517
1518     /* elf32_fdpic_loadmap */
1519     sp -= 4;
1520     put_user_u16(0, sp+0); /* version */
1521     put_user_u16(info->nsegs, sp+2); /* nsegs */
1522
1523     info->personality = PER_LINUX_FDPIC;
1524     info->loadmap_addr = sp;
1525
1526     return sp;
1527 }
1528 #endif
1529
1530 static abi_ulong create_elf_tables(abi_ulong p, int argc, int envc,
1531                                    struct elfhdr *exec,
1532                                    struct image_info *info,
1533                                    struct image_info *interp_info)
1534 {
1535     abi_ulong sp;
1536     abi_ulong sp_auxv;
1537     int size;
1538     int i;
1539     abi_ulong u_rand_bytes;
1540     uint8_t k_rand_bytes[16];
1541     abi_ulong u_platform;
1542     const char *k_platform;
1543     const int n = sizeof(elf_addr_t);
1544
1545     sp = p;
1546
1547 #ifdef CONFIG_USE_FDPIC
1548     /* Needs to be before we load the env/argc/... */
1549     if (elf_is_fdpic(exec)) {
1550         /* Need 4 byte alignment for these structs */
1551         sp &= ~3;
1552         sp = loader_build_fdpic_loadmap(info, sp);
1553         info->other_info = interp_info;
1554         if (interp_info) {
1555             interp_info->other_info = info;
1556             sp = loader_build_fdpic_loadmap(interp_info, sp);
1557         }
1558     }
1559 #endif
1560
1561     u_platform = 0;
1562     k_platform = ELF_PLATFORM;
1563     if (k_platform) {
1564         size_t len = strlen(k_platform) + 1;
1565         sp -= (len + n - 1) & ~(n - 1);
1566         u_platform = sp;
1567         /* FIXME - check return value of memcpy_to_target() for failure */
1568         memcpy_to_target(sp, k_platform, len);
1569     }
1570
1571     /*
1572      * Generate 16 random bytes for userspace PRNG seeding (not
1573      * cryptically secure but it's not the aim of QEMU).
1574      */
1575     for (i = 0; i < 16; i++) {
1576         k_rand_bytes[i] = rand();
1577     }
1578     sp -= 16;
1579     u_rand_bytes = sp;
1580     /* FIXME - check return value of memcpy_to_target() for failure */
1581     memcpy_to_target(sp, k_rand_bytes, 16);
1582
1583     /*
1584      * Force 16 byte _final_ alignment here for generality.
1585      */
1586     sp = sp &~ (abi_ulong)15;
1587     size = (DLINFO_ITEMS + 1) * 2;
1588     if (k_platform)
1589         size += 2;
1590 #ifdef DLINFO_ARCH_ITEMS
1591     size += DLINFO_ARCH_ITEMS * 2;
1592 #endif
1593 #ifdef ELF_HWCAP2
1594     size += 2;
1595 #endif
1596     size += envc + argc + 2;
1597     size += 1;  /* argc itself */
1598     size *= n;
1599     if (size & 15)
1600         sp -= 16 - (size & 15);
1601
1602     /* This is correct because Linux defines
1603      * elf_addr_t as Elf32_Off / Elf64_Off
1604      */
1605 #define NEW_AUX_ENT(id, val) do {               \
1606         sp -= n; put_user_ual(val, sp);         \
1607         sp -= n; put_user_ual(id, sp);          \
1608     } while(0)
1609
1610     sp_auxv = sp;
1611     NEW_AUX_ENT (AT_NULL, 0);
1612
1613     /* There must be exactly DLINFO_ITEMS entries here.  */
1614     NEW_AUX_ENT(AT_PHDR, (abi_ulong)(info->load_addr + exec->e_phoff));
1615     NEW_AUX_ENT(AT_PHENT, (abi_ulong)(sizeof (struct elf_phdr)));
1616     NEW_AUX_ENT(AT_PHNUM, (abi_ulong)(exec->e_phnum));
1617     NEW_AUX_ENT(AT_PAGESZ, (abi_ulong)(MAX(TARGET_PAGE_SIZE, getpagesize())));
1618     NEW_AUX_ENT(AT_BASE, (abi_ulong)(interp_info ? interp_info->load_addr : 0));
1619     NEW_AUX_ENT(AT_FLAGS, (abi_ulong)0);
1620     NEW_AUX_ENT(AT_ENTRY, info->entry);
1621     NEW_AUX_ENT(AT_UID, (abi_ulong) getuid());
1622     NEW_AUX_ENT(AT_EUID, (abi_ulong) geteuid());
1623     NEW_AUX_ENT(AT_GID, (abi_ulong) getgid());
1624     NEW_AUX_ENT(AT_EGID, (abi_ulong) getegid());
1625     NEW_AUX_ENT(AT_HWCAP, (abi_ulong) ELF_HWCAP);
1626     NEW_AUX_ENT(AT_CLKTCK, (abi_ulong) sysconf(_SC_CLK_TCK));
1627     NEW_AUX_ENT(AT_RANDOM, (abi_ulong) u_rand_bytes);
1628
1629 #ifdef ELF_HWCAP2
1630     NEW_AUX_ENT(AT_HWCAP2, (abi_ulong) ELF_HWCAP2);
1631 #endif
1632
1633     if (k_platform)
1634         NEW_AUX_ENT(AT_PLATFORM, u_platform);
1635 #ifdef ARCH_DLINFO
1636     /*
1637      * ARCH_DLINFO must come last so platform specific code can enforce
1638      * special alignment requirements on the AUXV if necessary (eg. PPC).
1639      */
1640     ARCH_DLINFO;
1641 #endif
1642 #undef NEW_AUX_ENT
1643
1644     info->saved_auxv = sp;
1645     info->auxv_len = sp_auxv - sp;
1646
1647     sp = loader_build_argptr(envc, argc, sp, p, 0);
1648     /* Check the right amount of stack was allocated for auxvec, envp & argv. */
1649     assert(sp_auxv - sp == size);
1650     return sp;
1651 }
1652
1653 #ifndef TARGET_HAS_VALIDATE_GUEST_SPACE
1654 /* If the guest doesn't have a validation function just agree */
1655 static int validate_guest_space(unsigned long guest_base,
1656                                 unsigned long guest_size)
1657 {
1658     return 1;
1659 }
1660 #endif
1661
1662 unsigned long init_guest_space(unsigned long host_start,
1663                                unsigned long host_size,
1664                                unsigned long guest_start,
1665                                bool fixed)
1666 {
1667     unsigned long current_start, real_start;
1668     int flags;
1669
1670     assert(host_start || host_size);
1671
1672     /* If just a starting address is given, then just verify that
1673      * address.  */
1674     if (host_start && !host_size) {
1675         if (validate_guest_space(host_start, host_size) == 1) {
1676             return host_start;
1677         } else {
1678             return (unsigned long)-1;
1679         }
1680     }
1681
1682     /* Setup the initial flags and start address.  */
1683     current_start = host_start & qemu_host_page_mask;
1684     flags = MAP_ANONYMOUS | MAP_PRIVATE | MAP_NORESERVE;
1685     if (fixed) {
1686         flags |= MAP_FIXED;
1687     }
1688
1689     /* Otherwise, a non-zero size region of memory needs to be mapped
1690      * and validated.  */
1691     while (1) {
1692         unsigned long real_size = host_size;
1693
1694         /* Do not use mmap_find_vma here because that is limited to the
1695          * guest address space.  We are going to make the
1696          * guest address space fit whatever we're given.
1697          */
1698         real_start = (unsigned long)
1699             mmap((void *)current_start, host_size, PROT_NONE, flags, -1, 0);
1700         if (real_start == (unsigned long)-1) {
1701             return (unsigned long)-1;
1702         }
1703
1704         /* Ensure the address is properly aligned.  */
1705         if (real_start & ~qemu_host_page_mask) {
1706             munmap((void *)real_start, host_size);
1707             real_size = host_size + qemu_host_page_size;
1708             real_start = (unsigned long)
1709                 mmap((void *)real_start, real_size, PROT_NONE, flags, -1, 0);
1710             if (real_start == (unsigned long)-1) {
1711                 return (unsigned long)-1;
1712             }
1713             real_start = HOST_PAGE_ALIGN(real_start);
1714         }
1715
1716         /* Check to see if the address is valid.  */
1717         if (!host_start || real_start == current_start) {
1718             int valid = validate_guest_space(real_start - guest_start,
1719                                              real_size);
1720             if (valid == 1) {
1721                 break;
1722             } else if (valid == -1) {
1723                 return (unsigned long)-1;
1724             }
1725             /* valid == 0, so try again. */
1726         }
1727
1728         /* That address didn't work.  Unmap and try a different one.
1729          * The address the host picked because is typically right at
1730          * the top of the host address space and leaves the guest with
1731          * no usable address space.  Resort to a linear search.  We
1732          * already compensated for mmap_min_addr, so this should not
1733          * happen often.  Probably means we got unlucky and host
1734          * address space randomization put a shared library somewhere
1735          * inconvenient.
1736          */
1737         munmap((void *)real_start, host_size);
1738         current_start += qemu_host_page_size;
1739         if (host_start == current_start) {
1740             /* Theoretically possible if host doesn't have any suitably
1741              * aligned areas.  Normally the first mmap will fail.
1742              */
1743             return (unsigned long)-1;
1744         }
1745     }
1746
1747     qemu_log("Reserved 0x%lx bytes of guest address space\n", host_size);
1748
1749     return real_start;
1750 }
1751
1752 static void probe_guest_base(const char *image_name,
1753                              abi_ulong loaddr, abi_ulong hiaddr)
1754 {
1755     /* Probe for a suitable guest base address, if the user has not set
1756      * it explicitly, and set guest_base appropriately.
1757      * In case of error we will print a suitable message and exit.
1758      */
1759 #if defined(CONFIG_USE_GUEST_BASE)
1760     const char *errmsg;
1761     if (!have_guest_base && !reserved_va) {
1762         unsigned long host_start, real_start, host_size;
1763
1764         /* Round addresses to page boundaries.  */
1765         loaddr &= qemu_host_page_mask;
1766         hiaddr = HOST_PAGE_ALIGN(hiaddr);
1767
1768         if (loaddr < mmap_min_addr) {
1769             host_start = HOST_PAGE_ALIGN(mmap_min_addr);
1770         } else {
1771             host_start = loaddr;
1772             if (host_start != loaddr) {
1773                 errmsg = "Address overflow loading ELF binary";
1774                 goto exit_errmsg;
1775             }
1776         }
1777         host_size = hiaddr - loaddr;
1778
1779         /* Setup the initial guest memory space with ranges gleaned from
1780          * the ELF image that is being loaded.
1781          */
1782         real_start = init_guest_space(host_start, host_size, loaddr, false);
1783         if (real_start == (unsigned long)-1) {
1784             errmsg = "Unable to find space for application";
1785             goto exit_errmsg;
1786         }
1787         guest_base = real_start - loaddr;
1788
1789         qemu_log("Relocating guest address space from 0x"
1790                  TARGET_ABI_FMT_lx " to 0x%lx\n",
1791                  loaddr, real_start);
1792     }
1793     return;
1794
1795 exit_errmsg:
1796     fprintf(stderr, "%s: %s\n", image_name, errmsg);
1797     exit(-1);
1798 #endif
1799 }
1800
1801
1802 /* Load an ELF image into the address space.
1803
1804    IMAGE_NAME is the filename of the image, to use in error messages.
1805    IMAGE_FD is the open file descriptor for the image.
1806
1807    BPRM_BUF is a copy of the beginning of the file; this of course
1808    contains the elf file header at offset 0.  It is assumed that this
1809    buffer is sufficiently aligned to present no problems to the host
1810    in accessing data at aligned offsets within the buffer.
1811
1812    On return: INFO values will be filled in, as necessary or available.  */
1813
1814 static void load_elf_image(const char *image_name, int image_fd,
1815                            struct image_info *info, char **pinterp_name,
1816                            char bprm_buf[BPRM_BUF_SIZE])
1817 {
1818     struct elfhdr *ehdr = (struct elfhdr *)bprm_buf;
1819     struct elf_phdr *phdr;
1820     abi_ulong load_addr, load_bias, loaddr, hiaddr, error;
1821     int i, retval;
1822     const char *errmsg;
1823
1824     /* First of all, some simple consistency checks */
1825     errmsg = "Invalid ELF image for this architecture";
1826     if (!elf_check_ident(ehdr)) {
1827         goto exit_errmsg;
1828     }
1829     bswap_ehdr(ehdr);
1830     if (!elf_check_ehdr(ehdr)) {
1831         goto exit_errmsg;
1832     }
1833
1834     i = ehdr->e_phnum * sizeof(struct elf_phdr);
1835     if (ehdr->e_phoff + i <= BPRM_BUF_SIZE) {
1836         phdr = (struct elf_phdr *)(bprm_buf + ehdr->e_phoff);
1837     } else {
1838         phdr = (struct elf_phdr *) alloca(i);
1839         retval = pread(image_fd, phdr, i, ehdr->e_phoff);
1840         if (retval != i) {
1841             goto exit_read;
1842         }
1843     }
1844     bswap_phdr(phdr, ehdr->e_phnum);
1845
1846 #ifdef CONFIG_USE_FDPIC
1847     info->nsegs = 0;
1848     info->pt_dynamic_addr = 0;
1849 #endif
1850
1851     /* Find the maximum size of the image and allocate an appropriate
1852        amount of memory to handle that.  */
1853     loaddr = -1, hiaddr = 0;
1854     for (i = 0; i < ehdr->e_phnum; ++i) {
1855         if (phdr[i].p_type == PT_LOAD) {
1856             abi_ulong a = phdr[i].p_vaddr - phdr[i].p_offset;
1857             if (a < loaddr) {
1858                 loaddr = a;
1859             }
1860             a = phdr[i].p_vaddr + phdr[i].p_memsz;
1861             if (a > hiaddr) {
1862                 hiaddr = a;
1863             }
1864 #ifdef CONFIG_USE_FDPIC
1865             ++info->nsegs;
1866 #endif
1867         }
1868     }
1869
1870     load_addr = loaddr;
1871     if (ehdr->e_type == ET_DYN) {
1872         /* The image indicates that it can be loaded anywhere.  Find a
1873            location that can hold the memory space required.  If the
1874            image is pre-linked, LOADDR will be non-zero.  Since we do
1875            not supply MAP_FIXED here we'll use that address if and
1876            only if it remains available.  */
1877         load_addr = target_mmap(loaddr, hiaddr - loaddr, PROT_NONE,
1878                                 MAP_PRIVATE | MAP_ANON | MAP_NORESERVE,
1879                                 -1, 0);
1880         if (load_addr == -1) {
1881             goto exit_perror;
1882         }
1883     } else if (pinterp_name != NULL) {
1884         /* This is the main executable.  Make sure that the low
1885            address does not conflict with MMAP_MIN_ADDR or the
1886            QEMU application itself.  */
1887         probe_guest_base(image_name, loaddr, hiaddr);
1888     }
1889     load_bias = load_addr - loaddr;
1890
1891 #ifdef CONFIG_USE_FDPIC
1892     {
1893         struct elf32_fdpic_loadseg *loadsegs = info->loadsegs =
1894             g_malloc(sizeof(*loadsegs) * info->nsegs);
1895
1896         for (i = 0; i < ehdr->e_phnum; ++i) {
1897             switch (phdr[i].p_type) {
1898             case PT_DYNAMIC:
1899                 info->pt_dynamic_addr = phdr[i].p_vaddr + load_bias;
1900                 break;
1901             case PT_LOAD:
1902                 loadsegs->addr = phdr[i].p_vaddr + load_bias;
1903                 loadsegs->p_vaddr = phdr[i].p_vaddr;
1904                 loadsegs->p_memsz = phdr[i].p_memsz;
1905                 ++loadsegs;
1906                 break;
1907             }
1908         }
1909     }
1910 #endif
1911
1912     info->load_bias = load_bias;
1913     info->load_addr = load_addr;
1914     info->entry = ehdr->e_entry + load_bias;
1915     info->start_code = -1;
1916     info->end_code = 0;
1917     info->start_data = -1;
1918     info->end_data = 0;
1919     info->brk = 0;
1920     info->elf_flags = ehdr->e_flags;
1921
1922     for (i = 0; i < ehdr->e_phnum; i++) {
1923         struct elf_phdr *eppnt = phdr + i;
1924         if (eppnt->p_type == PT_LOAD) {
1925             abi_ulong vaddr, vaddr_po, vaddr_ps, vaddr_ef, vaddr_em;
1926             int elf_prot = 0;
1927
1928             if (eppnt->p_flags & PF_R) elf_prot =  PROT_READ;
1929             if (eppnt->p_flags & PF_W) elf_prot |= PROT_WRITE;
1930             if (eppnt->p_flags & PF_X) elf_prot |= PROT_EXEC;
1931
1932             vaddr = load_bias + eppnt->p_vaddr;
1933             vaddr_po = TARGET_ELF_PAGEOFFSET(vaddr);
1934             vaddr_ps = TARGET_ELF_PAGESTART(vaddr);
1935
1936             error = target_mmap(vaddr_ps, eppnt->p_filesz + vaddr_po,
1937                                 elf_prot, MAP_PRIVATE | MAP_FIXED,
1938                                 image_fd, eppnt->p_offset - vaddr_po);
1939             if (error == -1) {
1940                 goto exit_perror;
1941             }
1942
1943             vaddr_ef = vaddr + eppnt->p_filesz;
1944             vaddr_em = vaddr + eppnt->p_memsz;
1945
1946             /* If the load segment requests extra zeros (e.g. bss), map it.  */
1947             if (vaddr_ef < vaddr_em) {
1948                 zero_bss(vaddr_ef, vaddr_em, elf_prot);
1949             }
1950
1951             /* Find the full program boundaries.  */
1952             if (elf_prot & PROT_EXEC) {
1953                 if (vaddr < info->start_code) {
1954                     info->start_code = vaddr;
1955                 }
1956                 if (vaddr_ef > info->end_code) {
1957                     info->end_code = vaddr_ef;
1958                 }
1959             }
1960             if (elf_prot & PROT_WRITE) {
1961                 if (vaddr < info->start_data) {
1962                     info->start_data = vaddr;
1963                 }
1964                 if (vaddr_ef > info->end_data) {
1965                     info->end_data = vaddr_ef;
1966                 }
1967                 if (vaddr_em > info->brk) {
1968                     info->brk = vaddr_em;
1969                 }
1970             }
1971         } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
1972             char *interp_name;
1973
1974             if (*pinterp_name) {
1975                 errmsg = "Multiple PT_INTERP entries";
1976                 goto exit_errmsg;
1977             }
1978             interp_name = malloc(eppnt->p_filesz);
1979             if (!interp_name) {
1980                 goto exit_perror;
1981             }
1982
1983             if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
1984                 memcpy(interp_name, bprm_buf + eppnt->p_offset,
1985                        eppnt->p_filesz);
1986             } else {
1987                 retval = pread(image_fd, interp_name, eppnt->p_filesz,
1988                                eppnt->p_offset);
1989                 if (retval != eppnt->p_filesz) {
1990                     goto exit_perror;
1991                 }
1992             }
1993             if (interp_name[eppnt->p_filesz - 1] != 0) {
1994                 errmsg = "Invalid PT_INTERP entry";
1995                 goto exit_errmsg;
1996             }
1997             *pinterp_name = interp_name;
1998         }
1999     }
2000
2001     if (info->end_data == 0) {
2002         info->start_data = info->end_code;
2003         info->end_data = info->end_code;
2004         info->brk = info->end_code;
2005     }
2006
2007     if (qemu_log_enabled()) {
2008         load_symbols(ehdr, image_fd, load_bias);
2009     }
2010
2011     close(image_fd);
2012     return;
2013
2014  exit_read:
2015     if (retval >= 0) {
2016         errmsg = "Incomplete read of file header";
2017         goto exit_errmsg;
2018     }
2019  exit_perror:
2020     errmsg = strerror(errno);
2021  exit_errmsg:
2022     fprintf(stderr, "%s: %s\n", image_name, errmsg);
2023     exit(-1);
2024 }
2025
2026 static void load_elf_interp(const char *filename, struct image_info *info,
2027                             char bprm_buf[BPRM_BUF_SIZE])
2028 {
2029     int fd, retval;
2030
2031     fd = open(path(filename), O_RDONLY);
2032     if (fd < 0) {
2033         goto exit_perror;
2034     }
2035
2036     retval = read(fd, bprm_buf, BPRM_BUF_SIZE);
2037     if (retval < 0) {
2038         goto exit_perror;
2039     }
2040     if (retval < BPRM_BUF_SIZE) {
2041         memset(bprm_buf + retval, 0, BPRM_BUF_SIZE - retval);
2042     }
2043
2044     load_elf_image(filename, fd, info, NULL, bprm_buf);
2045     return;
2046
2047  exit_perror:
2048     fprintf(stderr, "%s: %s\n", filename, strerror(errno));
2049     exit(-1);
2050 }
2051
2052 static int symfind(const void *s0, const void *s1)
2053 {
2054     target_ulong addr = *(target_ulong *)s0;
2055     struct elf_sym *sym = (struct elf_sym *)s1;
2056     int result = 0;
2057     if (addr < sym->st_value) {
2058         result = -1;
2059     } else if (addr >= sym->st_value + sym->st_size) {
2060         result = 1;
2061     }
2062     return result;
2063 }
2064
2065 static const char *lookup_symbolxx(struct syminfo *s, target_ulong orig_addr)
2066 {
2067 #if ELF_CLASS == ELFCLASS32
2068     struct elf_sym *syms = s->disas_symtab.elf32;
2069 #else
2070     struct elf_sym *syms = s->disas_symtab.elf64;
2071 #endif
2072
2073     // binary search
2074     struct elf_sym *sym;
2075
2076     sym = bsearch(&orig_addr, syms, s->disas_num_syms, sizeof(*syms), symfind);
2077     if (sym != NULL) {
2078         return s->disas_strtab + sym->st_name;
2079     }
2080
2081     return "";
2082 }
2083
2084 /* FIXME: This should use elf_ops.h  */
2085 static int symcmp(const void *s0, const void *s1)
2086 {
2087     struct elf_sym *sym0 = (struct elf_sym *)s0;
2088     struct elf_sym *sym1 = (struct elf_sym *)s1;
2089     return (sym0->st_value < sym1->st_value)
2090         ? -1
2091         : ((sym0->st_value > sym1->st_value) ? 1 : 0);
2092 }
2093
2094 /* Best attempt to load symbols from this ELF object. */
2095 static void load_symbols(struct elfhdr *hdr, int fd, abi_ulong load_bias)
2096 {
2097     int i, shnum, nsyms, sym_idx = 0, str_idx = 0;
2098     struct elf_shdr *shdr;
2099     char *strings = NULL;
2100     struct syminfo *s = NULL;
2101     struct elf_sym *new_syms, *syms = NULL;
2102
2103     shnum = hdr->e_shnum;
2104     i = shnum * sizeof(struct elf_shdr);
2105     shdr = (struct elf_shdr *)alloca(i);
2106     if (pread(fd, shdr, i, hdr->e_shoff) != i) {
2107         return;
2108     }
2109
2110     bswap_shdr(shdr, shnum);
2111     for (i = 0; i < shnum; ++i) {
2112         if (shdr[i].sh_type == SHT_SYMTAB) {
2113             sym_idx = i;
2114             str_idx = shdr[i].sh_link;
2115             goto found;
2116         }
2117     }
2118
2119     /* There will be no symbol table if the file was stripped.  */
2120     return;
2121
2122  found:
2123     /* Now know where the strtab and symtab are.  Snarf them.  */
2124     s = malloc(sizeof(*s));
2125     if (!s) {
2126         goto give_up;
2127     }
2128
2129     i = shdr[str_idx].sh_size;
2130     s->disas_strtab = strings = malloc(i);
2131     if (!strings || pread(fd, strings, i, shdr[str_idx].sh_offset) != i) {
2132         goto give_up;
2133     }
2134
2135     i = shdr[sym_idx].sh_size;
2136     syms = malloc(i);
2137     if (!syms || pread(fd, syms, i, shdr[sym_idx].sh_offset) != i) {
2138         goto give_up;
2139     }
2140
2141     nsyms = i / sizeof(struct elf_sym);
2142     for (i = 0; i < nsyms; ) {
2143         bswap_sym(syms + i);
2144         /* Throw away entries which we do not need.  */
2145         if (syms[i].st_shndx == SHN_UNDEF
2146             || syms[i].st_shndx >= SHN_LORESERVE
2147             || ELF_ST_TYPE(syms[i].st_info) != STT_FUNC) {
2148             if (i < --nsyms) {
2149                 syms[i] = syms[nsyms];
2150             }
2151         } else {
2152 #if defined(TARGET_ARM) || defined (TARGET_MIPS)
2153             /* The bottom address bit marks a Thumb or MIPS16 symbol.  */
2154             syms[i].st_value &= ~(target_ulong)1;
2155 #endif
2156             syms[i].st_value += load_bias;
2157             i++;
2158         }
2159     }
2160
2161     /* No "useful" symbol.  */
2162     if (nsyms == 0) {
2163         goto give_up;
2164     }
2165
2166     /* Attempt to free the storage associated with the local symbols
2167        that we threw away.  Whether or not this has any effect on the
2168        memory allocation depends on the malloc implementation and how
2169        many symbols we managed to discard.  */
2170     new_syms = realloc(syms, nsyms * sizeof(*syms));
2171     if (new_syms == NULL) {
2172         goto give_up;
2173     }
2174     syms = new_syms;
2175
2176     qsort(syms, nsyms, sizeof(*syms), symcmp);
2177
2178     s->disas_num_syms = nsyms;
2179 #if ELF_CLASS == ELFCLASS32
2180     s->disas_symtab.elf32 = syms;
2181 #else
2182     s->disas_symtab.elf64 = syms;
2183 #endif
2184     s->lookup_symbol = lookup_symbolxx;
2185     s->next = syminfos;
2186     syminfos = s;
2187
2188     return;
2189
2190 give_up:
2191     free(s);
2192     free(strings);
2193     free(syms);
2194 }
2195
2196 int load_elf_binary(struct linux_binprm *bprm, struct image_info *info)
2197 {
2198     struct image_info interp_info;
2199     struct elfhdr elf_ex;
2200     char *elf_interpreter = NULL;
2201
2202     info->start_mmap = (abi_ulong)ELF_START_MMAP;
2203     info->mmap = 0;
2204     info->rss = 0;
2205
2206     load_elf_image(bprm->filename, bprm->fd, info,
2207                    &elf_interpreter, bprm->buf);
2208
2209     /* ??? We need a copy of the elf header for passing to create_elf_tables.
2210        If we do nothing, we'll have overwritten this when we re-use bprm->buf
2211        when we load the interpreter.  */
2212     elf_ex = *(struct elfhdr *)bprm->buf;
2213
2214     bprm->p = copy_elf_strings(1, &bprm->filename, bprm->page, bprm->p);
2215     bprm->p = copy_elf_strings(bprm->envc,bprm->envp,bprm->page,bprm->p);
2216     bprm->p = copy_elf_strings(bprm->argc,bprm->argv,bprm->page,bprm->p);
2217     if (!bprm->p) {
2218         fprintf(stderr, "%s: %s\n", bprm->filename, strerror(E2BIG));
2219         exit(-1);
2220     }
2221
2222     /* Do this so that we can load the interpreter, if need be.  We will
2223        change some of these later */
2224     bprm->p = setup_arg_pages(bprm->p, bprm, info);
2225
2226     if (elf_interpreter) {
2227         load_elf_interp(elf_interpreter, &interp_info, bprm->buf);
2228
2229         /* If the program interpreter is one of these two, then assume
2230            an iBCS2 image.  Otherwise assume a native linux image.  */
2231
2232         if (strcmp(elf_interpreter, "/usr/lib/libc.so.1") == 0
2233             || strcmp(elf_interpreter, "/usr/lib/ld.so.1") == 0) {
2234             info->personality = PER_SVR4;
2235
2236             /* Why this, you ask???  Well SVr4 maps page 0 as read-only,
2237                and some applications "depend" upon this behavior.  Since
2238                we do not have the power to recompile these, we emulate
2239                the SVr4 behavior.  Sigh.  */
2240             target_mmap(0, qemu_host_page_size, PROT_READ | PROT_EXEC,
2241                         MAP_FIXED | MAP_PRIVATE, -1, 0);
2242         }
2243     }
2244
2245     bprm->p = create_elf_tables(bprm->p, bprm->argc, bprm->envc, &elf_ex,
2246                                 info, (elf_interpreter ? &interp_info : NULL));
2247     info->start_stack = bprm->p;
2248
2249     /* If we have an interpreter, set that as the program's entry point.
2250        Copy the load_bias as well, to help PPC64 interpret the entry
2251        point as a function descriptor.  Do this after creating elf tables
2252        so that we copy the original program entry point into the AUXV.  */
2253     if (elf_interpreter) {
2254         info->load_bias = interp_info.load_bias;
2255         info->entry = interp_info.entry;
2256         free(elf_interpreter);
2257     }
2258
2259 #ifdef USE_ELF_CORE_DUMP
2260     bprm->core_dump = &elf_core_dump;
2261 #endif
2262
2263     return 0;
2264 }
2265
2266 #ifdef USE_ELF_CORE_DUMP
2267 /*
2268  * Definitions to generate Intel SVR4-like core files.
2269  * These mostly have the same names as the SVR4 types with "target_elf_"
2270  * tacked on the front to prevent clashes with linux definitions,
2271  * and the typedef forms have been avoided.  This is mostly like
2272  * the SVR4 structure, but more Linuxy, with things that Linux does
2273  * not support and which gdb doesn't really use excluded.
2274  *
2275  * Fields we don't dump (their contents is zero) in linux-user qemu
2276  * are marked with XXX.
2277  *
2278  * Core dump code is copied from linux kernel (fs/binfmt_elf.c).
2279  *
2280  * Porting ELF coredump for target is (quite) simple process.  First you
2281  * define USE_ELF_CORE_DUMP in target ELF code (where init_thread() for
2282  * the target resides):
2283  *
2284  * #define USE_ELF_CORE_DUMP
2285  *
2286  * Next you define type of register set used for dumping.  ELF specification
2287  * says that it needs to be array of elf_greg_t that has size of ELF_NREG.
2288  *
2289  * typedef <target_regtype> target_elf_greg_t;
2290  * #define ELF_NREG <number of registers>
2291  * typedef taret_elf_greg_t target_elf_gregset_t[ELF_NREG];
2292  *
2293  * Last step is to implement target specific function that copies registers
2294  * from given cpu into just specified register set.  Prototype is:
2295  *
2296  * static void elf_core_copy_regs(taret_elf_gregset_t *regs,
2297  *                                const CPUArchState *env);
2298  *
2299  * Parameters:
2300  *     regs - copy register values into here (allocated and zeroed by caller)
2301  *     env - copy registers from here
2302  *
2303  * Example for ARM target is provided in this file.
2304  */
2305
2306 /* An ELF note in memory */
2307 struct memelfnote {
2308     const char *name;
2309     size_t     namesz;
2310     size_t     namesz_rounded;
2311     int        type;
2312     size_t     datasz;
2313     size_t     datasz_rounded;
2314     void       *data;
2315     size_t     notesz;
2316 };
2317
2318 struct target_elf_siginfo {
2319     abi_int    si_signo; /* signal number */
2320     abi_int    si_code;  /* extra code */
2321     abi_int    si_errno; /* errno */
2322 };
2323
2324 struct target_elf_prstatus {
2325     struct target_elf_siginfo pr_info;      /* Info associated with signal */
2326     abi_short          pr_cursig;    /* Current signal */
2327     abi_ulong          pr_sigpend;   /* XXX */
2328     abi_ulong          pr_sighold;   /* XXX */
2329     target_pid_t       pr_pid;
2330     target_pid_t       pr_ppid;
2331     target_pid_t       pr_pgrp;
2332     target_pid_t       pr_sid;
2333     struct target_timeval pr_utime;  /* XXX User time */
2334     struct target_timeval pr_stime;  /* XXX System time */
2335     struct target_timeval pr_cutime; /* XXX Cumulative user time */
2336     struct target_timeval pr_cstime; /* XXX Cumulative system time */
2337     target_elf_gregset_t      pr_reg;       /* GP registers */
2338     abi_int            pr_fpvalid;   /* XXX */
2339 };
2340
2341 #define ELF_PRARGSZ     (80) /* Number of chars for args */
2342
2343 struct target_elf_prpsinfo {
2344     char         pr_state;       /* numeric process state */
2345     char         pr_sname;       /* char for pr_state */
2346     char         pr_zomb;        /* zombie */
2347     char         pr_nice;        /* nice val */
2348     abi_ulong    pr_flag;        /* flags */
2349     target_uid_t pr_uid;
2350     target_gid_t pr_gid;
2351     target_pid_t pr_pid, pr_ppid, pr_pgrp, pr_sid;
2352     /* Lots missing */
2353     char    pr_fname[16];           /* filename of executable */
2354     char    pr_psargs[ELF_PRARGSZ]; /* initial part of arg list */
2355 };
2356
2357 /* Here is the structure in which status of each thread is captured. */
2358 struct elf_thread_status {
2359     QTAILQ_ENTRY(elf_thread_status)  ets_link;
2360     struct target_elf_prstatus prstatus;   /* NT_PRSTATUS */
2361 #if 0
2362     elf_fpregset_t fpu;             /* NT_PRFPREG */
2363     struct task_struct *thread;
2364     elf_fpxregset_t xfpu;           /* ELF_CORE_XFPREG_TYPE */
2365 #endif
2366     struct memelfnote notes[1];
2367     int num_notes;
2368 };
2369
2370 struct elf_note_info {
2371     struct memelfnote   *notes;
2372     struct target_elf_prstatus *prstatus;  /* NT_PRSTATUS */
2373     struct target_elf_prpsinfo *psinfo;    /* NT_PRPSINFO */
2374
2375     QTAILQ_HEAD(thread_list_head, elf_thread_status) thread_list;
2376 #if 0
2377     /*
2378      * Current version of ELF coredump doesn't support
2379      * dumping fp regs etc.
2380      */
2381     elf_fpregset_t *fpu;
2382     elf_fpxregset_t *xfpu;
2383     int thread_status_size;
2384 #endif
2385     int notes_size;
2386     int numnote;
2387 };
2388
2389 struct vm_area_struct {
2390     target_ulong   vma_start;  /* start vaddr of memory region */
2391     target_ulong   vma_end;    /* end vaddr of memory region */
2392     abi_ulong      vma_flags;  /* protection etc. flags for the region */
2393     QTAILQ_ENTRY(vm_area_struct) vma_link;
2394 };
2395
2396 struct mm_struct {
2397     QTAILQ_HEAD(, vm_area_struct) mm_mmap;
2398     int mm_count;           /* number of mappings */
2399 };
2400
2401 static struct mm_struct *vma_init(void);
2402 static void vma_delete(struct mm_struct *);
2403 static int vma_add_mapping(struct mm_struct *, target_ulong,
2404                            target_ulong, abi_ulong);
2405 static int vma_get_mapping_count(const struct mm_struct *);
2406 static struct vm_area_struct *vma_first(const struct mm_struct *);
2407 static struct vm_area_struct *vma_next(struct vm_area_struct *);
2408 static abi_ulong vma_dump_size(const struct vm_area_struct *);
2409 static int vma_walker(void *priv, target_ulong start, target_ulong end,
2410                       unsigned long flags);
2411
2412 static void fill_elf_header(struct elfhdr *, int, uint16_t, uint32_t);
2413 static void fill_note(struct memelfnote *, const char *, int,
2414                       unsigned int, void *);
2415 static void fill_prstatus(struct target_elf_prstatus *, const TaskState *, int);
2416 static int fill_psinfo(struct target_elf_prpsinfo *, const TaskState *);
2417 static void fill_auxv_note(struct memelfnote *, const TaskState *);
2418 static void fill_elf_note_phdr(struct elf_phdr *, int, off_t);
2419 static size_t note_size(const struct memelfnote *);
2420 static void free_note_info(struct elf_note_info *);
2421 static int fill_note_info(struct elf_note_info *, long, const CPUArchState *);
2422 static void fill_thread_info(struct elf_note_info *, const CPUArchState *);
2423 static int core_dump_filename(const TaskState *, char *, size_t);
2424
2425 static int dump_write(int, const void *, size_t);
2426 static int write_note(struct memelfnote *, int);
2427 static int write_note_info(struct elf_note_info *, int);
2428
2429 #ifdef BSWAP_NEEDED
2430 static void bswap_prstatus(struct target_elf_prstatus *prstatus)
2431 {
2432     prstatus->pr_info.si_signo = tswap32(prstatus->pr_info.si_signo);
2433     prstatus->pr_info.si_code = tswap32(prstatus->pr_info.si_code);
2434     prstatus->pr_info.si_errno = tswap32(prstatus->pr_info.si_errno);
2435     prstatus->pr_cursig = tswap16(prstatus->pr_cursig);
2436     prstatus->pr_sigpend = tswapal(prstatus->pr_sigpend);
2437     prstatus->pr_sighold = tswapal(prstatus->pr_sighold);
2438     prstatus->pr_pid = tswap32(prstatus->pr_pid);
2439     prstatus->pr_ppid = tswap32(prstatus->pr_ppid);
2440     prstatus->pr_pgrp = tswap32(prstatus->pr_pgrp);
2441     prstatus->pr_sid = tswap32(prstatus->pr_sid);
2442     /* cpu times are not filled, so we skip them */
2443     /* regs should be in correct format already */
2444     prstatus->pr_fpvalid = tswap32(prstatus->pr_fpvalid);
2445 }
2446
2447 static void bswap_psinfo(struct target_elf_prpsinfo *psinfo)
2448 {
2449     psinfo->pr_flag = tswapal(psinfo->pr_flag);
2450     psinfo->pr_uid = tswap16(psinfo->pr_uid);
2451     psinfo->pr_gid = tswap16(psinfo->pr_gid);
2452     psinfo->pr_pid = tswap32(psinfo->pr_pid);
2453     psinfo->pr_ppid = tswap32(psinfo->pr_ppid);
2454     psinfo->pr_pgrp = tswap32(psinfo->pr_pgrp);
2455     psinfo->pr_sid = tswap32(psinfo->pr_sid);
2456 }
2457
2458 static void bswap_note(struct elf_note *en)
2459 {
2460     bswap32s(&en->n_namesz);
2461     bswap32s(&en->n_descsz);
2462     bswap32s(&en->n_type);
2463 }
2464 #else
2465 static inline void bswap_prstatus(struct target_elf_prstatus *p) { }
2466 static inline void bswap_psinfo(struct target_elf_prpsinfo *p) {}
2467 static inline void bswap_note(struct elf_note *en) { }
2468 #endif /* BSWAP_NEEDED */
2469
2470 /*
2471  * Minimal support for linux memory regions.  These are needed
2472  * when we are finding out what memory exactly belongs to
2473  * emulated process.  No locks needed here, as long as
2474  * thread that received the signal is stopped.
2475  */
2476
2477 static struct mm_struct *vma_init(void)
2478 {
2479     struct mm_struct *mm;
2480
2481     if ((mm = g_malloc(sizeof (*mm))) == NULL)
2482         return (NULL);
2483
2484     mm->mm_count = 0;
2485     QTAILQ_INIT(&mm->mm_mmap);
2486
2487     return (mm);
2488 }
2489
2490 static void vma_delete(struct mm_struct *mm)
2491 {
2492     struct vm_area_struct *vma;
2493
2494     while ((vma = vma_first(mm)) != NULL) {
2495         QTAILQ_REMOVE(&mm->mm_mmap, vma, vma_link);
2496         g_free(vma);
2497     }
2498     g_free(mm);
2499 }
2500
2501 static int vma_add_mapping(struct mm_struct *mm, target_ulong start,
2502                            target_ulong end, abi_ulong flags)
2503 {
2504     struct vm_area_struct *vma;
2505
2506     if ((vma = g_malloc0(sizeof (*vma))) == NULL)
2507         return (-1);
2508
2509     vma->vma_start = start;
2510     vma->vma_end = end;
2511     vma->vma_flags = flags;
2512
2513     QTAILQ_INSERT_TAIL(&mm->mm_mmap, vma, vma_link);
2514     mm->mm_count++;
2515
2516     return (0);
2517 }
2518
2519 static struct vm_area_struct *vma_first(const struct mm_struct *mm)
2520 {
2521     return (QTAILQ_FIRST(&mm->mm_mmap));
2522 }
2523
2524 static struct vm_area_struct *vma_next(struct vm_area_struct *vma)
2525 {
2526     return (QTAILQ_NEXT(vma, vma_link));
2527 }
2528
2529 static int vma_get_mapping_count(const struct mm_struct *mm)
2530 {
2531     return (mm->mm_count);
2532 }
2533
2534 /*
2535  * Calculate file (dump) size of given memory region.
2536  */
2537 static abi_ulong vma_dump_size(const struct vm_area_struct *vma)
2538 {
2539     /* if we cannot even read the first page, skip it */
2540     if (!access_ok(VERIFY_READ, vma->vma_start, TARGET_PAGE_SIZE))
2541         return (0);
2542
2543     /*
2544      * Usually we don't dump executable pages as they contain
2545      * non-writable code that debugger can read directly from
2546      * target library etc.  However, thread stacks are marked
2547      * also executable so we read in first page of given region
2548      * and check whether it contains elf header.  If there is
2549      * no elf header, we dump it.
2550      */
2551     if (vma->vma_flags & PROT_EXEC) {
2552         char page[TARGET_PAGE_SIZE];
2553
2554         copy_from_user(page, vma->vma_start, sizeof (page));
2555         if ((page[EI_MAG0] == ELFMAG0) &&
2556             (page[EI_MAG1] == ELFMAG1) &&
2557             (page[EI_MAG2] == ELFMAG2) &&
2558             (page[EI_MAG3] == ELFMAG3)) {
2559             /*
2560              * Mappings are possibly from ELF binary.  Don't dump
2561              * them.
2562              */
2563             return (0);
2564         }
2565     }
2566
2567     return (vma->vma_end - vma->vma_start);
2568 }
2569
2570 static int vma_walker(void *priv, target_ulong start, target_ulong end,
2571                       unsigned long flags)
2572 {
2573     struct mm_struct *mm = (struct mm_struct *)priv;
2574
2575     vma_add_mapping(mm, start, end, flags);
2576     return (0);
2577 }
2578
2579 static void fill_note(struct memelfnote *note, const char *name, int type,
2580                       unsigned int sz, void *data)
2581 {
2582     unsigned int namesz;
2583
2584     namesz = strlen(name) + 1;
2585     note->name = name;
2586     note->namesz = namesz;
2587     note->namesz_rounded = roundup(namesz, sizeof (int32_t));
2588     note->type = type;
2589     note->datasz = sz;
2590     note->datasz_rounded = roundup(sz, sizeof (int32_t));
2591
2592     note->data = data;
2593
2594     /*
2595      * We calculate rounded up note size here as specified by
2596      * ELF document.
2597      */
2598     note->notesz = sizeof (struct elf_note) +
2599         note->namesz_rounded + note->datasz_rounded;
2600 }
2601
2602 static void fill_elf_header(struct elfhdr *elf, int segs, uint16_t machine,
2603                             uint32_t flags)
2604 {
2605     (void) memset(elf, 0, sizeof(*elf));
2606
2607     (void) memcpy(elf->e_ident, ELFMAG, SELFMAG);
2608     elf->e_ident[EI_CLASS] = ELF_CLASS;
2609     elf->e_ident[EI_DATA] = ELF_DATA;
2610     elf->e_ident[EI_VERSION] = EV_CURRENT;
2611     elf->e_ident[EI_OSABI] = ELF_OSABI;
2612
2613     elf->e_type = ET_CORE;
2614     elf->e_machine = machine;
2615     elf->e_version = EV_CURRENT;
2616     elf->e_phoff = sizeof(struct elfhdr);
2617     elf->e_flags = flags;
2618     elf->e_ehsize = sizeof(struct elfhdr);
2619     elf->e_phentsize = sizeof(struct elf_phdr);
2620     elf->e_phnum = segs;
2621
2622     bswap_ehdr(elf);
2623 }
2624
2625 static void fill_elf_note_phdr(struct elf_phdr *phdr, int sz, off_t offset)
2626 {
2627     phdr->p_type = PT_NOTE;
2628     phdr->p_offset = offset;
2629     phdr->p_vaddr = 0;
2630     phdr->p_paddr = 0;
2631     phdr->p_filesz = sz;
2632     phdr->p_memsz = 0;
2633     phdr->p_flags = 0;
2634     phdr->p_align = 0;
2635
2636     bswap_phdr(phdr, 1);
2637 }
2638
2639 static size_t note_size(const struct memelfnote *note)
2640 {
2641     return (note->notesz);
2642 }
2643
2644 static void fill_prstatus(struct target_elf_prstatus *prstatus,
2645                           const TaskState *ts, int signr)
2646 {
2647     (void) memset(prstatus, 0, sizeof (*prstatus));
2648     prstatus->pr_info.si_signo = prstatus->pr_cursig = signr;
2649     prstatus->pr_pid = ts->ts_tid;
2650     prstatus->pr_ppid = getppid();
2651     prstatus->pr_pgrp = getpgrp();
2652     prstatus->pr_sid = getsid(0);
2653
2654     bswap_prstatus(prstatus);
2655 }
2656
2657 static int fill_psinfo(struct target_elf_prpsinfo *psinfo, const TaskState *ts)
2658 {
2659     char *base_filename;
2660     unsigned int i, len;
2661
2662     (void) memset(psinfo, 0, sizeof (*psinfo));
2663
2664     len = ts->info->arg_end - ts->info->arg_start;
2665     if (len >= ELF_PRARGSZ)
2666         len = ELF_PRARGSZ - 1;
2667     if (copy_from_user(&psinfo->pr_psargs, ts->info->arg_start, len))
2668         return -EFAULT;
2669     for (i = 0; i < len; i++)
2670         if (psinfo->pr_psargs[i] == 0)
2671             psinfo->pr_psargs[i] = ' ';
2672     psinfo->pr_psargs[len] = 0;
2673
2674     psinfo->pr_pid = getpid();
2675     psinfo->pr_ppid = getppid();
2676     psinfo->pr_pgrp = getpgrp();
2677     psinfo->pr_sid = getsid(0);
2678     psinfo->pr_uid = getuid();
2679     psinfo->pr_gid = getgid();
2680
2681     base_filename = g_path_get_basename(ts->bprm->filename);
2682     /*
2683      * Using strncpy here is fine: at max-length,
2684      * this field is not NUL-terminated.
2685      */
2686     (void) strncpy(psinfo->pr_fname, base_filename,
2687                    sizeof(psinfo->pr_fname));
2688
2689     g_free(base_filename);
2690     bswap_psinfo(psinfo);
2691     return (0);
2692 }
2693
2694 static void fill_auxv_note(struct memelfnote *note, const TaskState *ts)
2695 {
2696     elf_addr_t auxv = (elf_addr_t)ts->info->saved_auxv;
2697     elf_addr_t orig_auxv = auxv;
2698     void *ptr;
2699     int len = ts->info->auxv_len;
2700
2701     /*
2702      * Auxiliary vector is stored in target process stack.  It contains
2703      * {type, value} pairs that we need to dump into note.  This is not
2704      * strictly necessary but we do it here for sake of completeness.
2705      */
2706
2707     /* read in whole auxv vector and copy it to memelfnote */
2708     ptr = lock_user(VERIFY_READ, orig_auxv, len, 0);
2709     if (ptr != NULL) {
2710         fill_note(note, "CORE", NT_AUXV, len, ptr);
2711         unlock_user(ptr, auxv, len);
2712     }
2713 }
2714
2715 /*
2716  * Constructs name of coredump file.  We have following convention
2717  * for the name:
2718  *     qemu_<basename-of-target-binary>_<date>-<time>_<pid>.core
2719  *
2720  * Returns 0 in case of success, -1 otherwise (errno is set).
2721  */
2722 static int core_dump_filename(const TaskState *ts, char *buf,
2723                               size_t bufsize)
2724 {
2725     char timestamp[64];
2726     char *filename = NULL;
2727     char *base_filename = NULL;
2728     struct timeval tv;
2729     struct tm tm;
2730
2731     assert(bufsize >= PATH_MAX);
2732
2733     if (gettimeofday(&tv, NULL) < 0) {
2734         (void) fprintf(stderr, "unable to get current timestamp: %s",
2735                        strerror(errno));
2736         return (-1);
2737     }
2738
2739     filename = strdup(ts->bprm->filename);
2740     base_filename = strdup(basename(filename));
2741     (void) strftime(timestamp, sizeof (timestamp), "%Y%m%d-%H%M%S",
2742                     localtime_r(&tv.tv_sec, &tm));
2743     (void) snprintf(buf, bufsize, "qemu_%s_%s_%d.core",
2744                     base_filename, timestamp, (int)getpid());
2745     free(base_filename);
2746     free(filename);
2747
2748     return (0);
2749 }
2750
2751 static int dump_write(int fd, const void *ptr, size_t size)
2752 {
2753     const char *bufp = (const char *)ptr;
2754     ssize_t bytes_written, bytes_left;
2755     struct rlimit dumpsize;
2756     off_t pos;
2757
2758     bytes_written = 0;
2759     getrlimit(RLIMIT_CORE, &dumpsize);
2760     if ((pos = lseek(fd, 0, SEEK_CUR))==-1) {
2761         if (errno == ESPIPE) { /* not a seekable stream */
2762             bytes_left = size;
2763         } else {
2764             return pos;
2765         }
2766     } else {
2767         if (dumpsize.rlim_cur <= pos) {
2768             return -1;
2769         } else if (dumpsize.rlim_cur == RLIM_INFINITY) {
2770             bytes_left = size;
2771         } else {
2772             size_t limit_left=dumpsize.rlim_cur - pos;
2773             bytes_left = limit_left >= size ? size : limit_left ;
2774         }
2775     }
2776
2777     /*
2778      * In normal conditions, single write(2) should do but
2779      * in case of socket etc. this mechanism is more portable.
2780      */
2781     do {
2782         bytes_written = write(fd, bufp, bytes_left);
2783         if (bytes_written < 0) {
2784             if (errno == EINTR)
2785                 continue;
2786             return (-1);
2787         } else if (bytes_written == 0) { /* eof */
2788             return (-1);
2789         }
2790         bufp += bytes_written;
2791         bytes_left -= bytes_written;
2792     } while (bytes_left > 0);
2793
2794     return (0);
2795 }
2796
2797 static int write_note(struct memelfnote *men, int fd)
2798 {
2799     struct elf_note en;
2800
2801     en.n_namesz = men->namesz;
2802     en.n_type = men->type;
2803     en.n_descsz = men->datasz;
2804
2805     bswap_note(&en);
2806
2807     if (dump_write(fd, &en, sizeof(en)) != 0)
2808         return (-1);
2809     if (dump_write(fd, men->name, men->namesz_rounded) != 0)
2810         return (-1);
2811     if (dump_write(fd, men->data, men->datasz_rounded) != 0)
2812         return (-1);
2813
2814     return (0);
2815 }
2816
2817 static void fill_thread_info(struct elf_note_info *info, const CPUArchState *env)
2818 {
2819     CPUState *cpu = ENV_GET_CPU((CPUArchState *)env);
2820     TaskState *ts = (TaskState *)cpu->opaque;
2821     struct elf_thread_status *ets;
2822
2823     ets = g_malloc0(sizeof (*ets));
2824     ets->num_notes = 1; /* only prstatus is dumped */
2825     fill_prstatus(&ets->prstatus, ts, 0);
2826     elf_core_copy_regs(&ets->prstatus.pr_reg, env);
2827     fill_note(&ets->notes[0], "CORE", NT_PRSTATUS, sizeof (ets->prstatus),
2828               &ets->prstatus);
2829
2830     QTAILQ_INSERT_TAIL(&info->thread_list, ets, ets_link);
2831
2832     info->notes_size += note_size(&ets->notes[0]);
2833 }
2834
2835 static void init_note_info(struct elf_note_info *info)
2836 {
2837     /* Initialize the elf_note_info structure so that it is at
2838      * least safe to call free_note_info() on it. Must be
2839      * called before calling fill_note_info().
2840      */
2841     memset(info, 0, sizeof (*info));
2842     QTAILQ_INIT(&info->thread_list);
2843 }
2844
2845 static int fill_note_info(struct elf_note_info *info,
2846                           long signr, const CPUArchState *env)
2847 {
2848 #define NUMNOTES 3
2849     CPUState *cpu = ENV_GET_CPU((CPUArchState *)env);
2850     TaskState *ts = (TaskState *)cpu->opaque;
2851     int i;
2852
2853     info->notes = g_malloc0(NUMNOTES * sizeof (struct memelfnote));
2854     if (info->notes == NULL)
2855         return (-ENOMEM);
2856     info->prstatus = g_malloc0(sizeof (*info->prstatus));
2857     if (info->prstatus == NULL)
2858         return (-ENOMEM);
2859     info->psinfo = g_malloc0(sizeof (*info->psinfo));
2860     if (info->prstatus == NULL)
2861         return (-ENOMEM);
2862
2863     /*
2864      * First fill in status (and registers) of current thread
2865      * including process info & aux vector.
2866      */
2867     fill_prstatus(info->prstatus, ts, signr);
2868     elf_core_copy_regs(&info->prstatus->pr_reg, env);
2869     fill_note(&info->notes[0], "CORE", NT_PRSTATUS,
2870               sizeof (*info->prstatus), info->prstatus);
2871     fill_psinfo(info->psinfo, ts);
2872     fill_note(&info->notes[1], "CORE", NT_PRPSINFO,
2873               sizeof (*info->psinfo), info->psinfo);
2874     fill_auxv_note(&info->notes[2], ts);
2875     info->numnote = 3;
2876
2877     info->notes_size = 0;
2878     for (i = 0; i < info->numnote; i++)
2879         info->notes_size += note_size(&info->notes[i]);
2880
2881     /* read and fill status of all threads */
2882     cpu_list_lock();
2883     CPU_FOREACH(cpu) {
2884         if (cpu == thread_cpu) {
2885             continue;
2886         }
2887         fill_thread_info(info, (CPUArchState *)cpu->env_ptr);
2888     }
2889     cpu_list_unlock();
2890
2891     return (0);
2892 }
2893
2894 static void free_note_info(struct elf_note_info *info)
2895 {
2896     struct elf_thread_status *ets;
2897
2898     while (!QTAILQ_EMPTY(&info->thread_list)) {
2899         ets = QTAILQ_FIRST(&info->thread_list);
2900         QTAILQ_REMOVE(&info->thread_list, ets, ets_link);
2901         g_free(ets);
2902     }
2903
2904     g_free(info->prstatus);
2905     g_free(info->psinfo);
2906     g_free(info->notes);
2907 }
2908
2909 static int write_note_info(struct elf_note_info *info, int fd)
2910 {
2911     struct elf_thread_status *ets;
2912     int i, error = 0;
2913
2914     /* write prstatus, psinfo and auxv for current thread */
2915     for (i = 0; i < info->numnote; i++)
2916         if ((error = write_note(&info->notes[i], fd)) != 0)
2917             return (error);
2918
2919     /* write prstatus for each thread */
2920     QTAILQ_FOREACH(ets, &info->thread_list, ets_link) {
2921         if ((error = write_note(&ets->notes[0], fd)) != 0)
2922             return (error);
2923     }
2924
2925     return (0);
2926 }
2927
2928 /*
2929  * Write out ELF coredump.
2930  *
2931  * See documentation of ELF object file format in:
2932  * http://www.caldera.com/developers/devspecs/gabi41.pdf
2933  *
2934  * Coredump format in linux is following:
2935  *
2936  * 0   +----------------------+         \
2937  *     | ELF header           | ET_CORE  |
2938  *     +----------------------+          |
2939  *     | ELF program headers  |          |--- headers
2940  *     | - NOTE section       |          |
2941  *     | - PT_LOAD sections   |          |
2942  *     +----------------------+         /
2943  *     | NOTEs:               |
2944  *     | - NT_PRSTATUS        |
2945  *     | - NT_PRSINFO         |
2946  *     | - NT_AUXV            |
2947  *     +----------------------+ <-- aligned to target page
2948  *     | Process memory dump  |
2949  *     :                      :
2950  *     .                      .
2951  *     :                      :
2952  *     |                      |
2953  *     +----------------------+
2954  *
2955  * NT_PRSTATUS -> struct elf_prstatus (per thread)
2956  * NT_PRSINFO  -> struct elf_prpsinfo
2957  * NT_AUXV is array of { type, value } pairs (see fill_auxv_note()).
2958  *
2959  * Format follows System V format as close as possible.  Current
2960  * version limitations are as follows:
2961  *     - no floating point registers are dumped
2962  *
2963  * Function returns 0 in case of success, negative errno otherwise.
2964  *
2965  * TODO: make this work also during runtime: it should be
2966  * possible to force coredump from running process and then
2967  * continue processing.  For example qemu could set up SIGUSR2
2968  * handler (provided that target process haven't registered
2969  * handler for that) that does the dump when signal is received.
2970  */
2971 static int elf_core_dump(int signr, const CPUArchState *env)
2972 {
2973     const CPUState *cpu = ENV_GET_CPU((CPUArchState *)env);
2974     const TaskState *ts = (const TaskState *)cpu->opaque;
2975     struct vm_area_struct *vma = NULL;
2976     char corefile[PATH_MAX];
2977     struct elf_note_info info;
2978     struct elfhdr elf;
2979     struct elf_phdr phdr;
2980     struct rlimit dumpsize;
2981     struct mm_struct *mm = NULL;
2982     off_t offset = 0, data_offset = 0;
2983     int segs = 0;
2984     int fd = -1;
2985
2986     init_note_info(&info);
2987
2988     errno = 0;
2989     getrlimit(RLIMIT_CORE, &dumpsize);
2990     if (dumpsize.rlim_cur == 0)
2991         return 0;
2992
2993     if (core_dump_filename(ts, corefile, sizeof (corefile)) < 0)
2994         return (-errno);
2995
2996     if ((fd = open(corefile, O_WRONLY | O_CREAT,
2997                    S_IRUSR|S_IWUSR|S_IRGRP|S_IROTH)) < 0)
2998         return (-errno);
2999
3000     /*
3001      * Walk through target process memory mappings and
3002      * set up structure containing this information.  After
3003      * this point vma_xxx functions can be used.
3004      */
3005     if ((mm = vma_init()) == NULL)
3006         goto out;
3007
3008     walk_memory_regions(mm, vma_walker);
3009     segs = vma_get_mapping_count(mm);
3010
3011     /*
3012      * Construct valid coredump ELF header.  We also
3013      * add one more segment for notes.
3014      */
3015     fill_elf_header(&elf, segs + 1, ELF_MACHINE, 0);
3016     if (dump_write(fd, &elf, sizeof (elf)) != 0)
3017         goto out;
3018
3019     /* fill in in-memory version of notes */
3020     if (fill_note_info(&info, signr, env) < 0)
3021         goto out;
3022
3023     offset += sizeof (elf);                             /* elf header */
3024     offset += (segs + 1) * sizeof (struct elf_phdr);    /* program headers */
3025
3026     /* write out notes program header */
3027     fill_elf_note_phdr(&phdr, info.notes_size, offset);
3028
3029     offset += info.notes_size;
3030     if (dump_write(fd, &phdr, sizeof (phdr)) != 0)
3031         goto out;
3032
3033     /*
3034      * ELF specification wants data to start at page boundary so
3035      * we align it here.
3036      */
3037     data_offset = offset = roundup(offset, ELF_EXEC_PAGESIZE);
3038
3039     /*
3040      * Write program headers for memory regions mapped in
3041      * the target process.
3042      */
3043     for (vma = vma_first(mm); vma != NULL; vma = vma_next(vma)) {
3044         (void) memset(&phdr, 0, sizeof (phdr));
3045
3046         phdr.p_type = PT_LOAD;
3047         phdr.p_offset = offset;
3048         phdr.p_vaddr = vma->vma_start;
3049         phdr.p_paddr = 0;
3050         phdr.p_filesz = vma_dump_size(vma);
3051         offset += phdr.p_filesz;
3052         phdr.p_memsz = vma->vma_end - vma->vma_start;
3053         phdr.p_flags = vma->vma_flags & PROT_READ ? PF_R : 0;
3054         if (vma->vma_flags & PROT_WRITE)
3055             phdr.p_flags |= PF_W;
3056         if (vma->vma_flags & PROT_EXEC)
3057             phdr.p_flags |= PF_X;
3058         phdr.p_align = ELF_EXEC_PAGESIZE;
3059
3060         bswap_phdr(&phdr, 1);
3061         dump_write(fd, &phdr, sizeof (phdr));
3062     }
3063
3064     /*
3065      * Next we write notes just after program headers.  No
3066      * alignment needed here.
3067      */
3068     if (write_note_info(&info, fd) < 0)
3069         goto out;
3070
3071     /* align data to page boundary */
3072     if (lseek(fd, data_offset, SEEK_SET) != data_offset)
3073         goto out;
3074
3075     /*
3076      * Finally we can dump process memory into corefile as well.
3077      */
3078     for (vma = vma_first(mm); vma != NULL; vma = vma_next(vma)) {
3079         abi_ulong addr;
3080         abi_ulong end;
3081
3082         end = vma->vma_start + vma_dump_size(vma);
3083
3084         for (addr = vma->vma_start; addr < end;
3085              addr += TARGET_PAGE_SIZE) {
3086             char page[TARGET_PAGE_SIZE];
3087             int error;
3088
3089             /*
3090              *  Read in page from target process memory and
3091              *  write it to coredump file.
3092              */
3093             error = copy_from_user(page, addr, sizeof (page));
3094             if (error != 0) {
3095                 (void) fprintf(stderr, "unable to dump " TARGET_ABI_FMT_lx "\n",
3096                                addr);
3097                 errno = -error;
3098                 goto out;
3099             }
3100             if (dump_write(fd, page, TARGET_PAGE_SIZE) < 0)
3101                 goto out;
3102         }
3103     }
3104
3105  out:
3106     free_note_info(&info);
3107     if (mm != NULL)
3108         vma_delete(mm);
3109     (void) close(fd);
3110
3111     if (errno != 0)
3112         return (-errno);
3113     return (0);
3114 }
3115 #endif /* USE_ELF_CORE_DUMP */
3116
3117 void do_init_thread(struct target_pt_regs *regs, struct image_info *infop)
3118 {
3119     init_thread(regs, infop);
3120 }