Add qemu 2.4.0
[kvmfornfv.git] / qemu / bsd-user / syscall.c
1 /*
2  *  BSD syscalls
3  *
4  *  Copyright (c) 2003 - 2008 Fabrice Bellard
5  *
6  *  This program is free software; you can redistribute it and/or modify
7  *  it under the terms of the GNU General Public License as published by
8  *  the Free Software Foundation; either version 2 of the License, or
9  *  (at your option) any later version.
10  *
11  *  This program is distributed in the hope that it will be useful,
12  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
13  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  *  GNU General Public License for more details.
15  *
16  *  You should have received a copy of the GNU General Public License
17  *  along with this program; if not, see <http://www.gnu.org/licenses/>.
18  */
19 #include <stdlib.h>
20 #include <stdio.h>
21 #include <stdint.h>
22 #include <stdarg.h>
23 #include <string.h>
24 #include <errno.h>
25 #include <unistd.h>
26 #include <fcntl.h>
27 #include <time.h>
28 #include <limits.h>
29 #include <sys/types.h>
30 #include <sys/mman.h>
31 #include <sys/syscall.h>
32 #include <sys/param.h>
33 #include <sys/sysctl.h>
34 #include <utime.h>
35
36 #include "qemu.h"
37 #include "qemu-common.h"
38
39 //#define DEBUG
40
41 static abi_ulong target_brk;
42 static abi_ulong target_original_brk;
43
44 static inline abi_long get_errno(abi_long ret)
45 {
46     if (ret == -1)
47         /* XXX need to translate host -> target errnos here */
48         return -(errno);
49     else
50         return ret;
51 }
52
53 #define target_to_host_bitmask(x, tbl) (x)
54
55 static inline int is_error(abi_long ret)
56 {
57     return (abi_ulong)ret >= (abi_ulong)(-4096);
58 }
59
60 void target_set_brk(abi_ulong new_brk)
61 {
62     target_original_brk = target_brk = HOST_PAGE_ALIGN(new_brk);
63 }
64
65 /* do_obreak() must return target errnos. */
66 static abi_long do_obreak(abi_ulong new_brk)
67 {
68     abi_ulong brk_page;
69     abi_long mapped_addr;
70     int new_alloc_size;
71
72     if (!new_brk)
73         return 0;
74     if (new_brk < target_original_brk)
75         return -TARGET_EINVAL;
76
77     brk_page = HOST_PAGE_ALIGN(target_brk);
78
79     /* If the new brk is less than this, set it and we're done... */
80     if (new_brk < brk_page) {
81         target_brk = new_brk;
82         return 0;
83     }
84
85     /* We need to allocate more memory after the brk... */
86     new_alloc_size = HOST_PAGE_ALIGN(new_brk - brk_page + 1);
87     mapped_addr = get_errno(target_mmap(brk_page, new_alloc_size,
88                                         PROT_READ|PROT_WRITE,
89                                         MAP_ANON|MAP_FIXED|MAP_PRIVATE, -1, 0));
90
91     if (!is_error(mapped_addr))
92         target_brk = new_brk;
93     else
94         return mapped_addr;
95
96     return 0;
97 }
98
99 #if defined(TARGET_I386)
100 static abi_long do_freebsd_sysarch(CPUX86State *env, int op, abi_ulong parms)
101 {
102     abi_long ret = 0;
103     abi_ulong val;
104     int idx;
105
106     switch(op) {
107 #ifdef TARGET_ABI32
108     case TARGET_FREEBSD_I386_SET_GSBASE:
109     case TARGET_FREEBSD_I386_SET_FSBASE:
110         if (op == TARGET_FREEBSD_I386_SET_GSBASE)
111 #else
112     case TARGET_FREEBSD_AMD64_SET_GSBASE:
113     case TARGET_FREEBSD_AMD64_SET_FSBASE:
114         if (op == TARGET_FREEBSD_AMD64_SET_GSBASE)
115 #endif
116             idx = R_GS;
117         else
118             idx = R_FS;
119         if (get_user(val, parms, abi_ulong))
120             return -TARGET_EFAULT;
121         cpu_x86_load_seg(env, idx, 0);
122         env->segs[idx].base = val;
123         break;
124 #ifdef TARGET_ABI32
125     case TARGET_FREEBSD_I386_GET_GSBASE:
126     case TARGET_FREEBSD_I386_GET_FSBASE:
127         if (op == TARGET_FREEBSD_I386_GET_GSBASE)
128 #else
129     case TARGET_FREEBSD_AMD64_GET_GSBASE:
130     case TARGET_FREEBSD_AMD64_GET_FSBASE:
131         if (op == TARGET_FREEBSD_AMD64_GET_GSBASE)
132 #endif
133             idx = R_GS;
134         else
135             idx = R_FS;
136         val = env->segs[idx].base;
137         if (put_user(val, parms, abi_ulong))
138             return -TARGET_EFAULT;
139         break;
140     /* XXX handle the others... */
141     default:
142         ret = -TARGET_EINVAL;
143         break;
144     }
145     return ret;
146 }
147 #endif
148
149 #ifdef TARGET_SPARC
150 static abi_long do_freebsd_sysarch(void *env, int op, abi_ulong parms)
151 {
152     /* XXX handle
153      * TARGET_FREEBSD_SPARC_UTRAP_INSTALL,
154      * TARGET_FREEBSD_SPARC_SIGTRAMP_INSTALL
155      */
156     return -TARGET_EINVAL;
157 }
158 #endif
159
160 #ifdef __FreeBSD__
161 /*
162  * XXX this uses the undocumented oidfmt interface to find the kind of
163  * a requested sysctl, see /sys/kern/kern_sysctl.c:sysctl_sysctl_oidfmt()
164  * (this is mostly copied from src/sbin/sysctl/sysctl.c)
165  */
166 static int
167 oidfmt(int *oid, int len, char *fmt, uint32_t *kind)
168 {
169     int qoid[CTL_MAXNAME+2];
170     uint8_t buf[BUFSIZ];
171     int i;
172     size_t j;
173
174     qoid[0] = 0;
175     qoid[1] = 4;
176     memcpy(qoid + 2, oid, len * sizeof(int));
177
178     j = sizeof(buf);
179     i = sysctl(qoid, len + 2, buf, &j, 0, 0);
180     if (i)
181         return i;
182
183     if (kind)
184         *kind = *(uint32_t *)buf;
185
186     if (fmt)
187         strcpy(fmt, (char *)(buf + sizeof(uint32_t)));
188     return (0);
189 }
190
191 /*
192  * try and convert sysctl return data for the target.
193  * XXX doesn't handle CTLTYPE_OPAQUE and CTLTYPE_STRUCT.
194  */
195 static int sysctl_oldcvt(void *holdp, size_t holdlen, uint32_t kind)
196 {
197     switch (kind & CTLTYPE) {
198     case CTLTYPE_INT:
199     case CTLTYPE_UINT:
200         *(uint32_t *)holdp = tswap32(*(uint32_t *)holdp);
201         break;
202 #ifdef TARGET_ABI32
203     case CTLTYPE_LONG:
204     case CTLTYPE_ULONG:
205         *(uint32_t *)holdp = tswap32(*(long *)holdp);
206         break;
207 #else
208     case CTLTYPE_LONG:
209         *(uint64_t *)holdp = tswap64(*(long *)holdp);
210     case CTLTYPE_ULONG:
211         *(uint64_t *)holdp = tswap64(*(unsigned long *)holdp);
212         break;
213 #endif
214 #ifdef CTLTYPE_U64
215     case CTLTYPE_S64:
216     case CTLTYPE_U64:
217 #else
218     case CTLTYPE_QUAD:
219 #endif
220         *(uint64_t *)holdp = tswap64(*(uint64_t *)holdp);
221         break;
222     case CTLTYPE_STRING:
223         break;
224     default:
225         /* XXX unhandled */
226         return -1;
227     }
228     return 0;
229 }
230
231 /* XXX this needs to be emulated on non-FreeBSD hosts... */
232 static abi_long do_freebsd_sysctl(abi_ulong namep, int32_t namelen, abi_ulong oldp,
233                           abi_ulong oldlenp, abi_ulong newp, abi_ulong newlen)
234 {
235     abi_long ret;
236     void *hnamep, *holdp, *hnewp = NULL;
237     size_t holdlen;
238     abi_ulong oldlen = 0;
239     int32_t *snamep = g_malloc(sizeof(int32_t) * namelen), *p, *q, i;
240     uint32_t kind = 0;
241
242     if (oldlenp)
243         get_user_ual(oldlen, oldlenp);
244     if (!(hnamep = lock_user(VERIFY_READ, namep, namelen, 1)))
245         return -TARGET_EFAULT;
246     if (newp && !(hnewp = lock_user(VERIFY_READ, newp, newlen, 1)))
247         return -TARGET_EFAULT;
248     if (!(holdp = lock_user(VERIFY_WRITE, oldp, oldlen, 0)))
249         return -TARGET_EFAULT;
250     holdlen = oldlen;
251     for (p = hnamep, q = snamep, i = 0; i < namelen; p++, i++)
252        *q++ = tswap32(*p);
253     oidfmt(snamep, namelen, NULL, &kind);
254     /* XXX swap hnewp */
255     ret = get_errno(sysctl(snamep, namelen, holdp, &holdlen, hnewp, newlen));
256     if (!ret)
257         sysctl_oldcvt(holdp, holdlen, kind);
258     put_user_ual(holdlen, oldlenp);
259     unlock_user(hnamep, namep, 0);
260     unlock_user(holdp, oldp, holdlen);
261     if (hnewp)
262         unlock_user(hnewp, newp, 0);
263     g_free(snamep);
264     return ret;
265 }
266 #endif
267
268 /* FIXME
269  * lock_iovec()/unlock_iovec() have a return code of 0 for success where
270  * other lock functions have a return code of 0 for failure.
271  */
272 static abi_long lock_iovec(int type, struct iovec *vec, abi_ulong target_addr,
273                            int count, int copy)
274 {
275     struct target_iovec *target_vec;
276     abi_ulong base;
277     int i;
278
279     target_vec = lock_user(VERIFY_READ, target_addr, count * sizeof(struct target_iovec), 1);
280     if (!target_vec)
281         return -TARGET_EFAULT;
282     for(i = 0;i < count; i++) {
283         base = tswapl(target_vec[i].iov_base);
284         vec[i].iov_len = tswapl(target_vec[i].iov_len);
285         if (vec[i].iov_len != 0) {
286             vec[i].iov_base = lock_user(type, base, vec[i].iov_len, copy);
287             /* Don't check lock_user return value. We must call writev even
288                if a element has invalid base address. */
289         } else {
290             /* zero length pointer is ignored */
291             vec[i].iov_base = NULL;
292         }
293     }
294     unlock_user (target_vec, target_addr, 0);
295     return 0;
296 }
297
298 static abi_long unlock_iovec(struct iovec *vec, abi_ulong target_addr,
299                              int count, int copy)
300 {
301     struct target_iovec *target_vec;
302     abi_ulong base;
303     int i;
304
305     target_vec = lock_user(VERIFY_READ, target_addr, count * sizeof(struct target_iovec), 1);
306     if (!target_vec)
307         return -TARGET_EFAULT;
308     for(i = 0;i < count; i++) {
309         if (target_vec[i].iov_base) {
310             base = tswapl(target_vec[i].iov_base);
311             unlock_user(vec[i].iov_base, base, copy ? vec[i].iov_len : 0);
312         }
313     }
314     unlock_user (target_vec, target_addr, 0);
315
316     return 0;
317 }
318
319 /* do_syscall() should always have a single exit point at the end so
320    that actions, such as logging of syscall results, can be performed.
321    All errnos that do_syscall() returns must be -TARGET_<errcode>. */
322 abi_long do_freebsd_syscall(void *cpu_env, int num, abi_long arg1,
323                             abi_long arg2, abi_long arg3, abi_long arg4,
324                             abi_long arg5, abi_long arg6, abi_long arg7,
325                             abi_long arg8)
326 {
327     abi_long ret;
328     void *p;
329
330 #ifdef DEBUG
331     gemu_log("freebsd syscall %d\n", num);
332 #endif
333     if(do_strace)
334         print_freebsd_syscall(num, arg1, arg2, arg3, arg4, arg5, arg6);
335
336     switch(num) {
337     case TARGET_FREEBSD_NR_exit:
338 #ifdef TARGET_GPROF
339         _mcleanup();
340 #endif
341         gdb_exit(cpu_env, arg1);
342         /* XXX: should free thread stack and CPU env */
343         _exit(arg1);
344         ret = 0; /* avoid warning */
345         break;
346     case TARGET_FREEBSD_NR_read:
347         if (!(p = lock_user(VERIFY_WRITE, arg2, arg3, 0)))
348             goto efault;
349         ret = get_errno(read(arg1, p, arg3));
350         unlock_user(p, arg2, ret);
351         break;
352     case TARGET_FREEBSD_NR_write:
353         if (!(p = lock_user(VERIFY_READ, arg2, arg3, 1)))
354             goto efault;
355         ret = get_errno(write(arg1, p, arg3));
356         unlock_user(p, arg2, 0);
357         break;
358     case TARGET_FREEBSD_NR_writev:
359         {
360             int count = arg3;
361             struct iovec *vec;
362
363             vec = alloca(count * sizeof(struct iovec));
364             if (lock_iovec(VERIFY_READ, vec, arg2, count, 1) < 0)
365                 goto efault;
366             ret = get_errno(writev(arg1, vec, count));
367             unlock_iovec(vec, arg2, count, 0);
368         }
369         break;
370     case TARGET_FREEBSD_NR_open:
371         if (!(p = lock_user_string(arg1)))
372             goto efault;
373         ret = get_errno(open(path(p),
374                              target_to_host_bitmask(arg2, fcntl_flags_tbl),
375                              arg3));
376         unlock_user(p, arg1, 0);
377         break;
378     case TARGET_FREEBSD_NR_mmap:
379         ret = get_errno(target_mmap(arg1, arg2, arg3,
380                                     target_to_host_bitmask(arg4, mmap_flags_tbl),
381                                     arg5,
382                                     arg6));
383         break;
384     case TARGET_FREEBSD_NR_mprotect:
385         ret = get_errno(target_mprotect(arg1, arg2, arg3));
386         break;
387     case TARGET_FREEBSD_NR_break:
388         ret = do_obreak(arg1);
389         break;
390 #ifdef __FreeBSD__
391     case TARGET_FREEBSD_NR___sysctl:
392         ret = do_freebsd_sysctl(arg1, arg2, arg3, arg4, arg5, arg6);
393         break;
394 #endif
395     case TARGET_FREEBSD_NR_sysarch:
396         ret = do_freebsd_sysarch(cpu_env, arg1, arg2);
397         break;
398     case TARGET_FREEBSD_NR_syscall:
399     case TARGET_FREEBSD_NR___syscall:
400         ret = do_freebsd_syscall(cpu_env,arg1 & 0xffff,arg2,arg3,arg4,arg5,arg6,arg7,arg8,0);
401         break;
402     default:
403         ret = get_errno(syscall(num, arg1, arg2, arg3, arg4, arg5, arg6, arg7, arg8));
404         break;
405     }
406  fail:
407 #ifdef DEBUG
408     gemu_log(" = %ld\n", ret);
409 #endif
410     if (do_strace)
411         print_freebsd_syscall_ret(num, ret);
412     return ret;
413  efault:
414     ret = -TARGET_EFAULT;
415     goto fail;
416 }
417
418 abi_long do_netbsd_syscall(void *cpu_env, int num, abi_long arg1,
419                            abi_long arg2, abi_long arg3, abi_long arg4,
420                            abi_long arg5, abi_long arg6)
421 {
422     abi_long ret;
423     void *p;
424
425 #ifdef DEBUG
426     gemu_log("netbsd syscall %d\n", num);
427 #endif
428     if(do_strace)
429         print_netbsd_syscall(num, arg1, arg2, arg3, arg4, arg5, arg6);
430
431     switch(num) {
432     case TARGET_NETBSD_NR_exit:
433 #ifdef TARGET_GPROF
434         _mcleanup();
435 #endif
436         gdb_exit(cpu_env, arg1);
437         /* XXX: should free thread stack and CPU env */
438         _exit(arg1);
439         ret = 0; /* avoid warning */
440         break;
441     case TARGET_NETBSD_NR_read:
442         if (!(p = lock_user(VERIFY_WRITE, arg2, arg3, 0)))
443             goto efault;
444         ret = get_errno(read(arg1, p, arg3));
445         unlock_user(p, arg2, ret);
446         break;
447     case TARGET_NETBSD_NR_write:
448         if (!(p = lock_user(VERIFY_READ, arg2, arg3, 1)))
449             goto efault;
450         ret = get_errno(write(arg1, p, arg3));
451         unlock_user(p, arg2, 0);
452         break;
453     case TARGET_NETBSD_NR_open:
454         if (!(p = lock_user_string(arg1)))
455             goto efault;
456         ret = get_errno(open(path(p),
457                              target_to_host_bitmask(arg2, fcntl_flags_tbl),
458                              arg3));
459         unlock_user(p, arg1, 0);
460         break;
461     case TARGET_NETBSD_NR_mmap:
462         ret = get_errno(target_mmap(arg1, arg2, arg3,
463                                     target_to_host_bitmask(arg4, mmap_flags_tbl),
464                                     arg5,
465                                     arg6));
466         break;
467     case TARGET_NETBSD_NR_mprotect:
468         ret = get_errno(target_mprotect(arg1, arg2, arg3));
469         break;
470     case TARGET_NETBSD_NR_syscall:
471     case TARGET_NETBSD_NR___syscall:
472         ret = do_netbsd_syscall(cpu_env,arg1 & 0xffff,arg2,arg3,arg4,arg5,arg6,0);
473         break;
474     default:
475         ret = syscall(num, arg1, arg2, arg3, arg4, arg5, arg6);
476         break;
477     }
478  fail:
479 #ifdef DEBUG
480     gemu_log(" = %ld\n", ret);
481 #endif
482     if (do_strace)
483         print_netbsd_syscall_ret(num, ret);
484     return ret;
485  efault:
486     ret = -TARGET_EFAULT;
487     goto fail;
488 }
489
490 abi_long do_openbsd_syscall(void *cpu_env, int num, abi_long arg1,
491                             abi_long arg2, abi_long arg3, abi_long arg4,
492                             abi_long arg5, abi_long arg6)
493 {
494     abi_long ret;
495     void *p;
496
497 #ifdef DEBUG
498     gemu_log("openbsd syscall %d\n", num);
499 #endif
500     if(do_strace)
501         print_openbsd_syscall(num, arg1, arg2, arg3, arg4, arg5, arg6);
502
503     switch(num) {
504     case TARGET_OPENBSD_NR_exit:
505 #ifdef TARGET_GPROF
506         _mcleanup();
507 #endif
508         gdb_exit(cpu_env, arg1);
509         /* XXX: should free thread stack and CPU env */
510         _exit(arg1);
511         ret = 0; /* avoid warning */
512         break;
513     case TARGET_OPENBSD_NR_read:
514         if (!(p = lock_user(VERIFY_WRITE, arg2, arg3, 0)))
515             goto efault;
516         ret = get_errno(read(arg1, p, arg3));
517         unlock_user(p, arg2, ret);
518         break;
519     case TARGET_OPENBSD_NR_write:
520         if (!(p = lock_user(VERIFY_READ, arg2, arg3, 1)))
521             goto efault;
522         ret = get_errno(write(arg1, p, arg3));
523         unlock_user(p, arg2, 0);
524         break;
525     case TARGET_OPENBSD_NR_open:
526         if (!(p = lock_user_string(arg1)))
527             goto efault;
528         ret = get_errno(open(path(p),
529                              target_to_host_bitmask(arg2, fcntl_flags_tbl),
530                              arg3));
531         unlock_user(p, arg1, 0);
532         break;
533     case TARGET_OPENBSD_NR_mmap:
534         ret = get_errno(target_mmap(arg1, arg2, arg3,
535                                     target_to_host_bitmask(arg4, mmap_flags_tbl),
536                                     arg5,
537                                     arg6));
538         break;
539     case TARGET_OPENBSD_NR_mprotect:
540         ret = get_errno(target_mprotect(arg1, arg2, arg3));
541         break;
542     case TARGET_OPENBSD_NR_syscall:
543     case TARGET_OPENBSD_NR___syscall:
544         ret = do_openbsd_syscall(cpu_env,arg1 & 0xffff,arg2,arg3,arg4,arg5,arg6,0);
545         break;
546     default:
547         ret = syscall(num, arg1, arg2, arg3, arg4, arg5, arg6);
548         break;
549     }
550  fail:
551 #ifdef DEBUG
552     gemu_log(" = %ld\n", ret);
553 #endif
554     if (do_strace)
555         print_openbsd_syscall_ret(num, ret);
556     return ret;
557  efault:
558     ret = -TARGET_EFAULT;
559     goto fail;
560 }
561
562 void syscall_init(void)
563 {
564 }