Linux-libre 3.14.42-gnu
[librecmc/linux-libre.git] / net / ipv4 / ip_sockglue.c
1 /*
2  * INET         An implementation of the TCP/IP protocol suite for the LINUX
3  *              operating system.  INET is implemented using the  BSD Socket
4  *              interface as the means of communication with the user level.
5  *
6  *              The IP to API glue.
7  *
8  * Authors:     see ip.c
9  *
10  * Fixes:
11  *              Many            :       Split from ip.c , see ip.c for history.
12  *              Martin Mares    :       TOS setting fixed.
13  *              Alan Cox        :       Fixed a couple of oopses in Martin's
14  *                                      TOS tweaks.
15  *              Mike McLagan    :       Routing by source
16  */
17
18 #include <linux/module.h>
19 #include <linux/types.h>
20 #include <linux/mm.h>
21 #include <linux/skbuff.h>
22 #include <linux/ip.h>
23 #include <linux/icmp.h>
24 #include <linux/inetdevice.h>
25 #include <linux/netdevice.h>
26 #include <linux/slab.h>
27 #include <net/sock.h>
28 #include <net/ip.h>
29 #include <net/icmp.h>
30 #include <net/tcp_states.h>
31 #include <linux/udp.h>
32 #include <linux/igmp.h>
33 #include <linux/netfilter.h>
34 #include <linux/route.h>
35 #include <linux/mroute.h>
36 #include <net/inet_ecn.h>
37 #include <net/route.h>
38 #include <net/xfrm.h>
39 #include <net/compat.h>
40 #if IS_ENABLED(CONFIG_IPV6)
41 #include <net/transp_v6.h>
42 #endif
43 #include <net/ip_fib.h>
44
45 #include <linux/errqueue.h>
46 #include <asm/uaccess.h>
47
48 #define IP_CMSG_PKTINFO         1
49 #define IP_CMSG_TTL             2
50 #define IP_CMSG_TOS             4
51 #define IP_CMSG_RECVOPTS        8
52 #define IP_CMSG_RETOPTS         16
53 #define IP_CMSG_PASSSEC         32
54 #define IP_CMSG_ORIGDSTADDR     64
55
56 /*
57  *      SOL_IP control messages.
58  */
59
60 static void ip_cmsg_recv_pktinfo(struct msghdr *msg, struct sk_buff *skb)
61 {
62         struct in_pktinfo info = *PKTINFO_SKB_CB(skb);
63
64         info.ipi_addr.s_addr = ip_hdr(skb)->daddr;
65
66         put_cmsg(msg, SOL_IP, IP_PKTINFO, sizeof(info), &info);
67 }
68
69 static void ip_cmsg_recv_ttl(struct msghdr *msg, struct sk_buff *skb)
70 {
71         int ttl = ip_hdr(skb)->ttl;
72         put_cmsg(msg, SOL_IP, IP_TTL, sizeof(int), &ttl);
73 }
74
75 static void ip_cmsg_recv_tos(struct msghdr *msg, struct sk_buff *skb)
76 {
77         put_cmsg(msg, SOL_IP, IP_TOS, 1, &ip_hdr(skb)->tos);
78 }
79
80 static void ip_cmsg_recv_opts(struct msghdr *msg, struct sk_buff *skb)
81 {
82         if (IPCB(skb)->opt.optlen == 0)
83                 return;
84
85         put_cmsg(msg, SOL_IP, IP_RECVOPTS, IPCB(skb)->opt.optlen,
86                  ip_hdr(skb) + 1);
87 }
88
89
90 static void ip_cmsg_recv_retopts(struct msghdr *msg, struct sk_buff *skb)
91 {
92         unsigned char optbuf[sizeof(struct ip_options) + 40];
93         struct ip_options *opt = (struct ip_options *)optbuf;
94
95         if (IPCB(skb)->opt.optlen == 0)
96                 return;
97
98         if (ip_options_echo(opt, skb)) {
99                 msg->msg_flags |= MSG_CTRUNC;
100                 return;
101         }
102         ip_options_undo(opt);
103
104         put_cmsg(msg, SOL_IP, IP_RETOPTS, opt->optlen, opt->__data);
105 }
106
107 static void ip_cmsg_recv_security(struct msghdr *msg, struct sk_buff *skb)
108 {
109         char *secdata;
110         u32 seclen, secid;
111         int err;
112
113         err = security_socket_getpeersec_dgram(NULL, skb, &secid);
114         if (err)
115                 return;
116
117         err = security_secid_to_secctx(secid, &secdata, &seclen);
118         if (err)
119                 return;
120
121         put_cmsg(msg, SOL_IP, SCM_SECURITY, seclen, secdata);
122         security_release_secctx(secdata, seclen);
123 }
124
125 static void ip_cmsg_recv_dstaddr(struct msghdr *msg, struct sk_buff *skb)
126 {
127         struct sockaddr_in sin;
128         const struct iphdr *iph = ip_hdr(skb);
129         __be16 *ports = (__be16 *)skb_transport_header(skb);
130
131         if (skb_transport_offset(skb) + 4 > skb->len)
132                 return;
133
134         /* All current transport protocols have the port numbers in the
135          * first four bytes of the transport header and this function is
136          * written with this assumption in mind.
137          */
138
139         sin.sin_family = AF_INET;
140         sin.sin_addr.s_addr = iph->daddr;
141         sin.sin_port = ports[1];
142         memset(sin.sin_zero, 0, sizeof(sin.sin_zero));
143
144         put_cmsg(msg, SOL_IP, IP_ORIGDSTADDR, sizeof(sin), &sin);
145 }
146
147 void ip_cmsg_recv(struct msghdr *msg, struct sk_buff *skb)
148 {
149         struct inet_sock *inet = inet_sk(skb->sk);
150         unsigned int flags = inet->cmsg_flags;
151
152         /* Ordered by supposed usage frequency */
153         if (flags & 1)
154                 ip_cmsg_recv_pktinfo(msg, skb);
155         if ((flags >>= 1) == 0)
156                 return;
157
158         if (flags & 1)
159                 ip_cmsg_recv_ttl(msg, skb);
160         if ((flags >>= 1) == 0)
161                 return;
162
163         if (flags & 1)
164                 ip_cmsg_recv_tos(msg, skb);
165         if ((flags >>= 1) == 0)
166                 return;
167
168         if (flags & 1)
169                 ip_cmsg_recv_opts(msg, skb);
170         if ((flags >>= 1) == 0)
171                 return;
172
173         if (flags & 1)
174                 ip_cmsg_recv_retopts(msg, skb);
175         if ((flags >>= 1) == 0)
176                 return;
177
178         if (flags & 1)
179                 ip_cmsg_recv_security(msg, skb);
180
181         if ((flags >>= 1) == 0)
182                 return;
183         if (flags & 1)
184                 ip_cmsg_recv_dstaddr(msg, skb);
185
186 }
187 EXPORT_SYMBOL(ip_cmsg_recv);
188
189 int ip_cmsg_send(struct net *net, struct msghdr *msg, struct ipcm_cookie *ipc)
190 {
191         int err, val;
192         struct cmsghdr *cmsg;
193
194         for (cmsg = CMSG_FIRSTHDR(msg); cmsg; cmsg = CMSG_NXTHDR(msg, cmsg)) {
195                 if (!CMSG_OK(msg, cmsg))
196                         return -EINVAL;
197                 if (cmsg->cmsg_level != SOL_IP)
198                         continue;
199                 switch (cmsg->cmsg_type) {
200                 case IP_RETOPTS:
201                         err = cmsg->cmsg_len - CMSG_ALIGN(sizeof(struct cmsghdr));
202                         err = ip_options_get(net, &ipc->opt, CMSG_DATA(cmsg),
203                                              err < 40 ? err : 40);
204                         if (err)
205                                 return err;
206                         break;
207                 case IP_PKTINFO:
208                 {
209                         struct in_pktinfo *info;
210                         if (cmsg->cmsg_len != CMSG_LEN(sizeof(struct in_pktinfo)))
211                                 return -EINVAL;
212                         info = (struct in_pktinfo *)CMSG_DATA(cmsg);
213                         ipc->oif = info->ipi_ifindex;
214                         ipc->addr = info->ipi_spec_dst.s_addr;
215                         break;
216                 }
217                 case IP_TTL:
218                         if (cmsg->cmsg_len != CMSG_LEN(sizeof(int)))
219                                 return -EINVAL;
220                         val = *(int *)CMSG_DATA(cmsg);
221                         if (val < 1 || val > 255)
222                                 return -EINVAL;
223                         ipc->ttl = val;
224                         break;
225                 case IP_TOS:
226                         if (cmsg->cmsg_len != CMSG_LEN(sizeof(int)))
227                                 return -EINVAL;
228                         val = *(int *)CMSG_DATA(cmsg);
229                         if (val < 0 || val > 255)
230                                 return -EINVAL;
231                         ipc->tos = val;
232                         ipc->priority = rt_tos2priority(ipc->tos);
233                         break;
234
235                 default:
236                         return -EINVAL;
237                 }
238         }
239         return 0;
240 }
241
242
243 /* Special input handler for packets caught by router alert option.
244    They are selected only by protocol field, and then processed likely
245    local ones; but only if someone wants them! Otherwise, router
246    not running rsvpd will kill RSVP.
247
248    It is user level problem, what it will make with them.
249    I have no idea, how it will masquearde or NAT them (it is joke, joke :-)),
250    but receiver should be enough clever f.e. to forward mtrace requests,
251    sent to multicast group to reach destination designated router.
252  */
253 struct ip_ra_chain __rcu *ip_ra_chain;
254 static DEFINE_SPINLOCK(ip_ra_lock);
255
256
257 static void ip_ra_destroy_rcu(struct rcu_head *head)
258 {
259         struct ip_ra_chain *ra = container_of(head, struct ip_ra_chain, rcu);
260
261         sock_put(ra->saved_sk);
262         kfree(ra);
263 }
264
265 int ip_ra_control(struct sock *sk, unsigned char on,
266                   void (*destructor)(struct sock *))
267 {
268         struct ip_ra_chain *ra, *new_ra;
269         struct ip_ra_chain __rcu **rap;
270
271         if (sk->sk_type != SOCK_RAW || inet_sk(sk)->inet_num == IPPROTO_RAW)
272                 return -EINVAL;
273
274         new_ra = on ? kmalloc(sizeof(*new_ra), GFP_KERNEL) : NULL;
275
276         spin_lock_bh(&ip_ra_lock);
277         for (rap = &ip_ra_chain;
278              (ra = rcu_dereference_protected(*rap,
279                         lockdep_is_held(&ip_ra_lock))) != NULL;
280              rap = &ra->next) {
281                 if (ra->sk == sk) {
282                         if (on) {
283                                 spin_unlock_bh(&ip_ra_lock);
284                                 kfree(new_ra);
285                                 return -EADDRINUSE;
286                         }
287                         /* dont let ip_call_ra_chain() use sk again */
288                         ra->sk = NULL;
289                         rcu_assign_pointer(*rap, ra->next);
290                         spin_unlock_bh(&ip_ra_lock);
291
292                         if (ra->destructor)
293                                 ra->destructor(sk);
294                         /*
295                          * Delay sock_put(sk) and kfree(ra) after one rcu grace
296                          * period. This guarantee ip_call_ra_chain() dont need
297                          * to mess with socket refcounts.
298                          */
299                         ra->saved_sk = sk;
300                         call_rcu(&ra->rcu, ip_ra_destroy_rcu);
301                         return 0;
302                 }
303         }
304         if (new_ra == NULL) {
305                 spin_unlock_bh(&ip_ra_lock);
306                 return -ENOBUFS;
307         }
308         new_ra->sk = sk;
309         new_ra->destructor = destructor;
310
311         new_ra->next = ra;
312         rcu_assign_pointer(*rap, new_ra);
313         sock_hold(sk);
314         spin_unlock_bh(&ip_ra_lock);
315
316         return 0;
317 }
318
319 void ip_icmp_error(struct sock *sk, struct sk_buff *skb, int err,
320                    __be16 port, u32 info, u8 *payload)
321 {
322         struct sock_exterr_skb *serr;
323
324         skb = skb_clone(skb, GFP_ATOMIC);
325         if (!skb)
326                 return;
327
328         serr = SKB_EXT_ERR(skb);
329         serr->ee.ee_errno = err;
330         serr->ee.ee_origin = SO_EE_ORIGIN_ICMP;
331         serr->ee.ee_type = icmp_hdr(skb)->type;
332         serr->ee.ee_code = icmp_hdr(skb)->code;
333         serr->ee.ee_pad = 0;
334         serr->ee.ee_info = info;
335         serr->ee.ee_data = 0;
336         serr->addr_offset = (u8 *)&(((struct iphdr *)(icmp_hdr(skb) + 1))->daddr) -
337                                    skb_network_header(skb);
338         serr->port = port;
339
340         if (skb_pull(skb, payload - skb->data) != NULL) {
341                 skb_reset_transport_header(skb);
342                 if (sock_queue_err_skb(sk, skb) == 0)
343                         return;
344         }
345         kfree_skb(skb);
346 }
347
348 void ip_local_error(struct sock *sk, int err, __be32 daddr, __be16 port, u32 info)
349 {
350         struct inet_sock *inet = inet_sk(sk);
351         struct sock_exterr_skb *serr;
352         struct iphdr *iph;
353         struct sk_buff *skb;
354
355         if (!inet->recverr)
356                 return;
357
358         skb = alloc_skb(sizeof(struct iphdr), GFP_ATOMIC);
359         if (!skb)
360                 return;
361
362         skb_put(skb, sizeof(struct iphdr));
363         skb_reset_network_header(skb);
364         iph = ip_hdr(skb);
365         iph->daddr = daddr;
366
367         serr = SKB_EXT_ERR(skb);
368         serr->ee.ee_errno = err;
369         serr->ee.ee_origin = SO_EE_ORIGIN_LOCAL;
370         serr->ee.ee_type = 0;
371         serr->ee.ee_code = 0;
372         serr->ee.ee_pad = 0;
373         serr->ee.ee_info = info;
374         serr->ee.ee_data = 0;
375         serr->addr_offset = (u8 *)&iph->daddr - skb_network_header(skb);
376         serr->port = port;
377
378         __skb_pull(skb, skb_tail_pointer(skb) - skb->data);
379         skb_reset_transport_header(skb);
380
381         if (sock_queue_err_skb(sk, skb))
382                 kfree_skb(skb);
383 }
384
385 /*
386  *      Handle MSG_ERRQUEUE
387  */
388 int ip_recv_error(struct sock *sk, struct msghdr *msg, int len, int *addr_len)
389 {
390         struct sock_exterr_skb *serr;
391         struct sk_buff *skb, *skb2;
392         DECLARE_SOCKADDR(struct sockaddr_in *, sin, msg->msg_name);
393         struct {
394                 struct sock_extended_err ee;
395                 struct sockaddr_in       offender;
396         } errhdr;
397         int err;
398         int copied;
399
400         err = -EAGAIN;
401         skb = skb_dequeue(&sk->sk_error_queue);
402         if (skb == NULL)
403                 goto out;
404
405         copied = skb->len;
406         if (copied > len) {
407                 msg->msg_flags |= MSG_TRUNC;
408                 copied = len;
409         }
410         err = skb_copy_datagram_iovec(skb, 0, msg->msg_iov, copied);
411         if (err)
412                 goto out_free_skb;
413
414         sock_recv_timestamp(msg, sk, skb);
415
416         serr = SKB_EXT_ERR(skb);
417
418         if (sin) {
419                 sin->sin_family = AF_INET;
420                 sin->sin_addr.s_addr = *(__be32 *)(skb_network_header(skb) +
421                                                    serr->addr_offset);
422                 sin->sin_port = serr->port;
423                 memset(&sin->sin_zero, 0, sizeof(sin->sin_zero));
424                 *addr_len = sizeof(*sin);
425         }
426
427         memcpy(&errhdr.ee, &serr->ee, sizeof(struct sock_extended_err));
428         sin = &errhdr.offender;
429         memset(sin, 0, sizeof(*sin));
430         if (serr->ee.ee_origin == SO_EE_ORIGIN_ICMP) {
431                 sin->sin_family = AF_INET;
432                 sin->sin_addr.s_addr = ip_hdr(skb)->saddr;
433                 if (inet_sk(sk)->cmsg_flags)
434                         ip_cmsg_recv(msg, skb);
435         }
436
437         put_cmsg(msg, SOL_IP, IP_RECVERR, sizeof(errhdr), &errhdr);
438
439         /* Now we could try to dump offended packet options */
440
441         msg->msg_flags |= MSG_ERRQUEUE;
442         err = copied;
443
444         /* Reset and regenerate socket error */
445         spin_lock_bh(&sk->sk_error_queue.lock);
446         sk->sk_err = 0;
447         skb2 = skb_peek(&sk->sk_error_queue);
448         if (skb2 != NULL) {
449                 sk->sk_err = SKB_EXT_ERR(skb2)->ee.ee_errno;
450                 spin_unlock_bh(&sk->sk_error_queue.lock);
451                 sk->sk_error_report(sk);
452         } else
453                 spin_unlock_bh(&sk->sk_error_queue.lock);
454
455 out_free_skb:
456         kfree_skb(skb);
457 out:
458         return err;
459 }
460
461
462 /*
463  *      Socket option code for IP. This is the end of the line after any
464  *      TCP,UDP etc options on an IP socket.
465  */
466
467 static int do_ip_setsockopt(struct sock *sk, int level,
468                             int optname, char __user *optval, unsigned int optlen)
469 {
470         struct inet_sock *inet = inet_sk(sk);
471         int val = 0, err;
472
473         switch (optname) {
474         case IP_PKTINFO:
475         case IP_RECVTTL:
476         case IP_RECVOPTS:
477         case IP_RECVTOS:
478         case IP_RETOPTS:
479         case IP_TOS:
480         case IP_TTL:
481         case IP_HDRINCL:
482         case IP_MTU_DISCOVER:
483         case IP_RECVERR:
484         case IP_ROUTER_ALERT:
485         case IP_FREEBIND:
486         case IP_PASSSEC:
487         case IP_TRANSPARENT:
488         case IP_MINTTL:
489         case IP_NODEFRAG:
490         case IP_UNICAST_IF:
491         case IP_MULTICAST_TTL:
492         case IP_MULTICAST_ALL:
493         case IP_MULTICAST_LOOP:
494         case IP_RECVORIGDSTADDR:
495                 if (optlen >= sizeof(int)) {
496                         if (get_user(val, (int __user *) optval))
497                                 return -EFAULT;
498                 } else if (optlen >= sizeof(char)) {
499                         unsigned char ucval;
500
501                         if (get_user(ucval, (unsigned char __user *) optval))
502                                 return -EFAULT;
503                         val = (int) ucval;
504                 }
505         }
506
507         /* If optlen==0, it is equivalent to val == 0 */
508
509         if (ip_mroute_opt(optname))
510                 return ip_mroute_setsockopt(sk, optname, optval, optlen);
511
512         err = 0;
513         lock_sock(sk);
514
515         switch (optname) {
516         case IP_OPTIONS:
517         {
518                 struct ip_options_rcu *old, *opt = NULL;
519
520                 if (optlen > 40)
521                         goto e_inval;
522                 err = ip_options_get_from_user(sock_net(sk), &opt,
523                                                optval, optlen);
524                 if (err)
525                         break;
526                 old = rcu_dereference_protected(inet->inet_opt,
527                                                 sock_owned_by_user(sk));
528                 if (inet->is_icsk) {
529                         struct inet_connection_sock *icsk = inet_csk(sk);
530 #if IS_ENABLED(CONFIG_IPV6)
531                         if (sk->sk_family == PF_INET ||
532                             (!((1 << sk->sk_state) &
533                                (TCPF_LISTEN | TCPF_CLOSE)) &&
534                              inet->inet_daddr != LOOPBACK4_IPV6)) {
535 #endif
536                                 if (old)
537                                         icsk->icsk_ext_hdr_len -= old->opt.optlen;
538                                 if (opt)
539                                         icsk->icsk_ext_hdr_len += opt->opt.optlen;
540                                 icsk->icsk_sync_mss(sk, icsk->icsk_pmtu_cookie);
541 #if IS_ENABLED(CONFIG_IPV6)
542                         }
543 #endif
544                 }
545                 rcu_assign_pointer(inet->inet_opt, opt);
546                 if (old)
547                         kfree_rcu(old, rcu);
548                 break;
549         }
550         case IP_PKTINFO:
551                 if (val)
552                         inet->cmsg_flags |= IP_CMSG_PKTINFO;
553                 else
554                         inet->cmsg_flags &= ~IP_CMSG_PKTINFO;
555                 break;
556         case IP_RECVTTL:
557                 if (val)
558                         inet->cmsg_flags |=  IP_CMSG_TTL;
559                 else
560                         inet->cmsg_flags &= ~IP_CMSG_TTL;
561                 break;
562         case IP_RECVTOS:
563                 if (val)
564                         inet->cmsg_flags |=  IP_CMSG_TOS;
565                 else
566                         inet->cmsg_flags &= ~IP_CMSG_TOS;
567                 break;
568         case IP_RECVOPTS:
569                 if (val)
570                         inet->cmsg_flags |=  IP_CMSG_RECVOPTS;
571                 else
572                         inet->cmsg_flags &= ~IP_CMSG_RECVOPTS;
573                 break;
574         case IP_RETOPTS:
575                 if (val)
576                         inet->cmsg_flags |= IP_CMSG_RETOPTS;
577                 else
578                         inet->cmsg_flags &= ~IP_CMSG_RETOPTS;
579                 break;
580         case IP_PASSSEC:
581                 if (val)
582                         inet->cmsg_flags |= IP_CMSG_PASSSEC;
583                 else
584                         inet->cmsg_flags &= ~IP_CMSG_PASSSEC;
585                 break;
586         case IP_RECVORIGDSTADDR:
587                 if (val)
588                         inet->cmsg_flags |= IP_CMSG_ORIGDSTADDR;
589                 else
590                         inet->cmsg_flags &= ~IP_CMSG_ORIGDSTADDR;
591                 break;
592         case IP_TOS:    /* This sets both TOS and Precedence */
593                 if (sk->sk_type == SOCK_STREAM) {
594                         val &= ~INET_ECN_MASK;
595                         val |= inet->tos & INET_ECN_MASK;
596                 }
597                 if (inet->tos != val) {
598                         inet->tos = val;
599                         sk->sk_priority = rt_tos2priority(val);
600                         sk_dst_reset(sk);
601                 }
602                 break;
603         case IP_TTL:
604                 if (optlen < 1)
605                         goto e_inval;
606                 if (val != -1 && (val < 1 || val > 255))
607                         goto e_inval;
608                 inet->uc_ttl = val;
609                 break;
610         case IP_HDRINCL:
611                 if (sk->sk_type != SOCK_RAW) {
612                         err = -ENOPROTOOPT;
613                         break;
614                 }
615                 inet->hdrincl = val ? 1 : 0;
616                 break;
617         case IP_NODEFRAG:
618                 if (sk->sk_type != SOCK_RAW) {
619                         err = -ENOPROTOOPT;
620                         break;
621                 }
622                 inet->nodefrag = val ? 1 : 0;
623                 break;
624         case IP_MTU_DISCOVER:
625                 if (val < IP_PMTUDISC_DONT || val > IP_PMTUDISC_INTERFACE)
626                         goto e_inval;
627                 inet->pmtudisc = val;
628                 break;
629         case IP_RECVERR:
630                 inet->recverr = !!val;
631                 if (!val)
632                         skb_queue_purge(&sk->sk_error_queue);
633                 break;
634         case IP_MULTICAST_TTL:
635                 if (sk->sk_type == SOCK_STREAM)
636                         goto e_inval;
637                 if (optlen < 1)
638                         goto e_inval;
639                 if (val == -1)
640                         val = 1;
641                 if (val < 0 || val > 255)
642                         goto e_inval;
643                 inet->mc_ttl = val;
644                 break;
645         case IP_MULTICAST_LOOP:
646                 if (optlen < 1)
647                         goto e_inval;
648                 inet->mc_loop = !!val;
649                 break;
650         case IP_UNICAST_IF:
651         {
652                 struct net_device *dev = NULL;
653                 int ifindex;
654
655                 if (optlen != sizeof(int))
656                         goto e_inval;
657
658                 ifindex = (__force int)ntohl((__force __be32)val);
659                 if (ifindex == 0) {
660                         inet->uc_index = 0;
661                         err = 0;
662                         break;
663                 }
664
665                 dev = dev_get_by_index(sock_net(sk), ifindex);
666                 err = -EADDRNOTAVAIL;
667                 if (!dev)
668                         break;
669                 dev_put(dev);
670
671                 err = -EINVAL;
672                 if (sk->sk_bound_dev_if)
673                         break;
674
675                 inet->uc_index = ifindex;
676                 err = 0;
677                 break;
678         }
679         case IP_MULTICAST_IF:
680         {
681                 struct ip_mreqn mreq;
682                 struct net_device *dev = NULL;
683
684                 if (sk->sk_type == SOCK_STREAM)
685                         goto e_inval;
686                 /*
687                  *      Check the arguments are allowable
688                  */
689
690                 if (optlen < sizeof(struct in_addr))
691                         goto e_inval;
692
693                 err = -EFAULT;
694                 if (optlen >= sizeof(struct ip_mreqn)) {
695                         if (copy_from_user(&mreq, optval, sizeof(mreq)))
696                                 break;
697                 } else {
698                         memset(&mreq, 0, sizeof(mreq));
699                         if (optlen >= sizeof(struct ip_mreq)) {
700                                 if (copy_from_user(&mreq, optval,
701                                                    sizeof(struct ip_mreq)))
702                                         break;
703                         } else if (optlen >= sizeof(struct in_addr)) {
704                                 if (copy_from_user(&mreq.imr_address, optval,
705                                                    sizeof(struct in_addr)))
706                                         break;
707                         }
708                 }
709
710                 if (!mreq.imr_ifindex) {
711                         if (mreq.imr_address.s_addr == htonl(INADDR_ANY)) {
712                                 inet->mc_index = 0;
713                                 inet->mc_addr  = 0;
714                                 err = 0;
715                                 break;
716                         }
717                         dev = ip_dev_find(sock_net(sk), mreq.imr_address.s_addr);
718                         if (dev)
719                                 mreq.imr_ifindex = dev->ifindex;
720                 } else
721                         dev = dev_get_by_index(sock_net(sk), mreq.imr_ifindex);
722
723
724                 err = -EADDRNOTAVAIL;
725                 if (!dev)
726                         break;
727                 dev_put(dev);
728
729                 err = -EINVAL;
730                 if (sk->sk_bound_dev_if &&
731                     mreq.imr_ifindex != sk->sk_bound_dev_if)
732                         break;
733
734                 inet->mc_index = mreq.imr_ifindex;
735                 inet->mc_addr  = mreq.imr_address.s_addr;
736                 err = 0;
737                 break;
738         }
739
740         case IP_ADD_MEMBERSHIP:
741         case IP_DROP_MEMBERSHIP:
742         {
743                 struct ip_mreqn mreq;
744
745                 err = -EPROTO;
746                 if (inet_sk(sk)->is_icsk)
747                         break;
748
749                 if (optlen < sizeof(struct ip_mreq))
750                         goto e_inval;
751                 err = -EFAULT;
752                 if (optlen >= sizeof(struct ip_mreqn)) {
753                         if (copy_from_user(&mreq, optval, sizeof(mreq)))
754                                 break;
755                 } else {
756                         memset(&mreq, 0, sizeof(mreq));
757                         if (copy_from_user(&mreq, optval, sizeof(struct ip_mreq)))
758                                 break;
759                 }
760
761                 if (optname == IP_ADD_MEMBERSHIP)
762                         err = ip_mc_join_group(sk, &mreq);
763                 else
764                         err = ip_mc_leave_group(sk, &mreq);
765                 break;
766         }
767         case IP_MSFILTER:
768         {
769                 struct ip_msfilter *msf;
770
771                 if (optlen < IP_MSFILTER_SIZE(0))
772                         goto e_inval;
773                 if (optlen > sysctl_optmem_max) {
774                         err = -ENOBUFS;
775                         break;
776                 }
777                 msf = kmalloc(optlen, GFP_KERNEL);
778                 if (!msf) {
779                         err = -ENOBUFS;
780                         break;
781                 }
782                 err = -EFAULT;
783                 if (copy_from_user(msf, optval, optlen)) {
784                         kfree(msf);
785                         break;
786                 }
787                 /* numsrc >= (1G-4) overflow in 32 bits */
788                 if (msf->imsf_numsrc >= 0x3ffffffcU ||
789                     msf->imsf_numsrc > sysctl_igmp_max_msf) {
790                         kfree(msf);
791                         err = -ENOBUFS;
792                         break;
793                 }
794                 if (IP_MSFILTER_SIZE(msf->imsf_numsrc) > optlen) {
795                         kfree(msf);
796                         err = -EINVAL;
797                         break;
798                 }
799                 err = ip_mc_msfilter(sk, msf, 0);
800                 kfree(msf);
801                 break;
802         }
803         case IP_BLOCK_SOURCE:
804         case IP_UNBLOCK_SOURCE:
805         case IP_ADD_SOURCE_MEMBERSHIP:
806         case IP_DROP_SOURCE_MEMBERSHIP:
807         {
808                 struct ip_mreq_source mreqs;
809                 int omode, add;
810
811                 if (optlen != sizeof(struct ip_mreq_source))
812                         goto e_inval;
813                 if (copy_from_user(&mreqs, optval, sizeof(mreqs))) {
814                         err = -EFAULT;
815                         break;
816                 }
817                 if (optname == IP_BLOCK_SOURCE) {
818                         omode = MCAST_EXCLUDE;
819                         add = 1;
820                 } else if (optname == IP_UNBLOCK_SOURCE) {
821                         omode = MCAST_EXCLUDE;
822                         add = 0;
823                 } else if (optname == IP_ADD_SOURCE_MEMBERSHIP) {
824                         struct ip_mreqn mreq;
825
826                         mreq.imr_multiaddr.s_addr = mreqs.imr_multiaddr;
827                         mreq.imr_address.s_addr = mreqs.imr_interface;
828                         mreq.imr_ifindex = 0;
829                         err = ip_mc_join_group(sk, &mreq);
830                         if (err && err != -EADDRINUSE)
831                                 break;
832                         omode = MCAST_INCLUDE;
833                         add = 1;
834                 } else /* IP_DROP_SOURCE_MEMBERSHIP */ {
835                         omode = MCAST_INCLUDE;
836                         add = 0;
837                 }
838                 err = ip_mc_source(add, omode, sk, &mreqs, 0);
839                 break;
840         }
841         case MCAST_JOIN_GROUP:
842         case MCAST_LEAVE_GROUP:
843         {
844                 struct group_req greq;
845                 struct sockaddr_in *psin;
846                 struct ip_mreqn mreq;
847
848                 if (optlen < sizeof(struct group_req))
849                         goto e_inval;
850                 err = -EFAULT;
851                 if (copy_from_user(&greq, optval, sizeof(greq)))
852                         break;
853                 psin = (struct sockaddr_in *)&greq.gr_group;
854                 if (psin->sin_family != AF_INET)
855                         goto e_inval;
856                 memset(&mreq, 0, sizeof(mreq));
857                 mreq.imr_multiaddr = psin->sin_addr;
858                 mreq.imr_ifindex = greq.gr_interface;
859
860                 if (optname == MCAST_JOIN_GROUP)
861                         err = ip_mc_join_group(sk, &mreq);
862                 else
863                         err = ip_mc_leave_group(sk, &mreq);
864                 break;
865         }
866         case MCAST_JOIN_SOURCE_GROUP:
867         case MCAST_LEAVE_SOURCE_GROUP:
868         case MCAST_BLOCK_SOURCE:
869         case MCAST_UNBLOCK_SOURCE:
870         {
871                 struct group_source_req greqs;
872                 struct ip_mreq_source mreqs;
873                 struct sockaddr_in *psin;
874                 int omode, add;
875
876                 if (optlen != sizeof(struct group_source_req))
877                         goto e_inval;
878                 if (copy_from_user(&greqs, optval, sizeof(greqs))) {
879                         err = -EFAULT;
880                         break;
881                 }
882                 if (greqs.gsr_group.ss_family != AF_INET ||
883                     greqs.gsr_source.ss_family != AF_INET) {
884                         err = -EADDRNOTAVAIL;
885                         break;
886                 }
887                 psin = (struct sockaddr_in *)&greqs.gsr_group;
888                 mreqs.imr_multiaddr = psin->sin_addr.s_addr;
889                 psin = (struct sockaddr_in *)&greqs.gsr_source;
890                 mreqs.imr_sourceaddr = psin->sin_addr.s_addr;
891                 mreqs.imr_interface = 0; /* use index for mc_source */
892
893                 if (optname == MCAST_BLOCK_SOURCE) {
894                         omode = MCAST_EXCLUDE;
895                         add = 1;
896                 } else if (optname == MCAST_UNBLOCK_SOURCE) {
897                         omode = MCAST_EXCLUDE;
898                         add = 0;
899                 } else if (optname == MCAST_JOIN_SOURCE_GROUP) {
900                         struct ip_mreqn mreq;
901
902                         psin = (struct sockaddr_in *)&greqs.gsr_group;
903                         mreq.imr_multiaddr = psin->sin_addr;
904                         mreq.imr_address.s_addr = 0;
905                         mreq.imr_ifindex = greqs.gsr_interface;
906                         err = ip_mc_join_group(sk, &mreq);
907                         if (err && err != -EADDRINUSE)
908                                 break;
909                         greqs.gsr_interface = mreq.imr_ifindex;
910                         omode = MCAST_INCLUDE;
911                         add = 1;
912                 } else /* MCAST_LEAVE_SOURCE_GROUP */ {
913                         omode = MCAST_INCLUDE;
914                         add = 0;
915                 }
916                 err = ip_mc_source(add, omode, sk, &mreqs,
917                                    greqs.gsr_interface);
918                 break;
919         }
920         case MCAST_MSFILTER:
921         {
922                 struct sockaddr_in *psin;
923                 struct ip_msfilter *msf = NULL;
924                 struct group_filter *gsf = NULL;
925                 int msize, i, ifindex;
926
927                 if (optlen < GROUP_FILTER_SIZE(0))
928                         goto e_inval;
929                 if (optlen > sysctl_optmem_max) {
930                         err = -ENOBUFS;
931                         break;
932                 }
933                 gsf = kmalloc(optlen, GFP_KERNEL);
934                 if (!gsf) {
935                         err = -ENOBUFS;
936                         break;
937                 }
938                 err = -EFAULT;
939                 if (copy_from_user(gsf, optval, optlen))
940                         goto mc_msf_out;
941
942                 /* numsrc >= (4G-140)/128 overflow in 32 bits */
943                 if (gsf->gf_numsrc >= 0x1ffffff ||
944                     gsf->gf_numsrc > sysctl_igmp_max_msf) {
945                         err = -ENOBUFS;
946                         goto mc_msf_out;
947                 }
948                 if (GROUP_FILTER_SIZE(gsf->gf_numsrc) > optlen) {
949                         err = -EINVAL;
950                         goto mc_msf_out;
951                 }
952                 msize = IP_MSFILTER_SIZE(gsf->gf_numsrc);
953                 msf = kmalloc(msize, GFP_KERNEL);
954                 if (!msf) {
955                         err = -ENOBUFS;
956                         goto mc_msf_out;
957                 }
958                 ifindex = gsf->gf_interface;
959                 psin = (struct sockaddr_in *)&gsf->gf_group;
960                 if (psin->sin_family != AF_INET) {
961                         err = -EADDRNOTAVAIL;
962                         goto mc_msf_out;
963                 }
964                 msf->imsf_multiaddr = psin->sin_addr.s_addr;
965                 msf->imsf_interface = 0;
966                 msf->imsf_fmode = gsf->gf_fmode;
967                 msf->imsf_numsrc = gsf->gf_numsrc;
968                 err = -EADDRNOTAVAIL;
969                 for (i = 0; i < gsf->gf_numsrc; ++i) {
970                         psin = (struct sockaddr_in *)&gsf->gf_slist[i];
971
972                         if (psin->sin_family != AF_INET)
973                                 goto mc_msf_out;
974                         msf->imsf_slist[i] = psin->sin_addr.s_addr;
975                 }
976                 kfree(gsf);
977                 gsf = NULL;
978
979                 err = ip_mc_msfilter(sk, msf, ifindex);
980 mc_msf_out:
981                 kfree(msf);
982                 kfree(gsf);
983                 break;
984         }
985         case IP_MULTICAST_ALL:
986                 if (optlen < 1)
987                         goto e_inval;
988                 if (val != 0 && val != 1)
989                         goto e_inval;
990                 inet->mc_all = val;
991                 break;
992         case IP_ROUTER_ALERT:
993                 err = ip_ra_control(sk, val ? 1 : 0, NULL);
994                 break;
995
996         case IP_FREEBIND:
997                 if (optlen < 1)
998                         goto e_inval;
999                 inet->freebind = !!val;
1000                 break;
1001
1002         case IP_IPSEC_POLICY:
1003         case IP_XFRM_POLICY:
1004                 err = -EPERM;
1005                 if (!ns_capable(sock_net(sk)->user_ns, CAP_NET_ADMIN))
1006                         break;
1007                 err = xfrm_user_policy(sk, optname, optval, optlen);
1008                 break;
1009
1010         case IP_TRANSPARENT:
1011                 if (!!val && !ns_capable(sock_net(sk)->user_ns, CAP_NET_RAW) &&
1012                     !ns_capable(sock_net(sk)->user_ns, CAP_NET_ADMIN)) {
1013                         err = -EPERM;
1014                         break;
1015                 }
1016                 if (optlen < 1)
1017                         goto e_inval;
1018                 inet->transparent = !!val;
1019                 break;
1020
1021         case IP_MINTTL:
1022                 if (optlen < 1)
1023                         goto e_inval;
1024                 if (val < 0 || val > 255)
1025                         goto e_inval;
1026                 inet->min_ttl = val;
1027                 break;
1028
1029         default:
1030                 err = -ENOPROTOOPT;
1031                 break;
1032         }
1033         release_sock(sk);
1034         return err;
1035
1036 e_inval:
1037         release_sock(sk);
1038         return -EINVAL;
1039 }
1040
1041 /**
1042  * ipv4_pktinfo_prepare - transfert some info from rtable to skb
1043  * @sk: socket
1044  * @skb: buffer
1045  *
1046  * To support IP_CMSG_PKTINFO option, we store rt_iif and specific
1047  * destination in skb->cb[] before dst drop.
1048  * This way, receiver doesn't make cache line misses to read rtable.
1049  */
1050 void ipv4_pktinfo_prepare(const struct sock *sk, struct sk_buff *skb)
1051 {
1052         struct in_pktinfo *pktinfo = PKTINFO_SKB_CB(skb);
1053         bool prepare = (inet_sk(sk)->cmsg_flags & IP_CMSG_PKTINFO) ||
1054                        ipv6_sk_rxinfo(sk);
1055
1056         if (prepare && skb_rtable(skb)) {
1057                 pktinfo->ipi_ifindex = inet_iif(skb);
1058                 pktinfo->ipi_spec_dst.s_addr = fib_compute_spec_dst(skb);
1059         } else {
1060                 pktinfo->ipi_ifindex = 0;
1061                 pktinfo->ipi_spec_dst.s_addr = 0;
1062         }
1063         skb_dst_drop(skb);
1064 }
1065
1066 int ip_setsockopt(struct sock *sk, int level,
1067                 int optname, char __user *optval, unsigned int optlen)
1068 {
1069         int err;
1070
1071         if (level != SOL_IP)
1072                 return -ENOPROTOOPT;
1073
1074         err = do_ip_setsockopt(sk, level, optname, optval, optlen);
1075 #ifdef CONFIG_NETFILTER
1076         /* we need to exclude all possible ENOPROTOOPTs except default case */
1077         if (err == -ENOPROTOOPT && optname != IP_HDRINCL &&
1078                         optname != IP_IPSEC_POLICY &&
1079                         optname != IP_XFRM_POLICY &&
1080                         !ip_mroute_opt(optname)) {
1081                 lock_sock(sk);
1082                 err = nf_setsockopt(sk, PF_INET, optname, optval, optlen);
1083                 release_sock(sk);
1084         }
1085 #endif
1086         return err;
1087 }
1088 EXPORT_SYMBOL(ip_setsockopt);
1089
1090 #ifdef CONFIG_COMPAT
1091 int compat_ip_setsockopt(struct sock *sk, int level, int optname,
1092                          char __user *optval, unsigned int optlen)
1093 {
1094         int err;
1095
1096         if (level != SOL_IP)
1097                 return -ENOPROTOOPT;
1098
1099         if (optname >= MCAST_JOIN_GROUP && optname <= MCAST_MSFILTER)
1100                 return compat_mc_setsockopt(sk, level, optname, optval, optlen,
1101                         ip_setsockopt);
1102
1103         err = do_ip_setsockopt(sk, level, optname, optval, optlen);
1104 #ifdef CONFIG_NETFILTER
1105         /* we need to exclude all possible ENOPROTOOPTs except default case */
1106         if (err == -ENOPROTOOPT && optname != IP_HDRINCL &&
1107                         optname != IP_IPSEC_POLICY &&
1108                         optname != IP_XFRM_POLICY &&
1109                         !ip_mroute_opt(optname)) {
1110                 lock_sock(sk);
1111                 err = compat_nf_setsockopt(sk, PF_INET, optname,
1112                                            optval, optlen);
1113                 release_sock(sk);
1114         }
1115 #endif
1116         return err;
1117 }
1118 EXPORT_SYMBOL(compat_ip_setsockopt);
1119 #endif
1120
1121 /*
1122  *      Get the options. Note for future reference. The GET of IP options gets
1123  *      the _received_ ones. The set sets the _sent_ ones.
1124  */
1125
1126 static int do_ip_getsockopt(struct sock *sk, int level, int optname,
1127                             char __user *optval, int __user *optlen, unsigned int flags)
1128 {
1129         struct inet_sock *inet = inet_sk(sk);
1130         int val;
1131         int len;
1132
1133         if (level != SOL_IP)
1134                 return -EOPNOTSUPP;
1135
1136         if (ip_mroute_opt(optname))
1137                 return ip_mroute_getsockopt(sk, optname, optval, optlen);
1138
1139         if (get_user(len, optlen))
1140                 return -EFAULT;
1141         if (len < 0)
1142                 return -EINVAL;
1143
1144         lock_sock(sk);
1145
1146         switch (optname) {
1147         case IP_OPTIONS:
1148         {
1149                 unsigned char optbuf[sizeof(struct ip_options)+40];
1150                 struct ip_options *opt = (struct ip_options *)optbuf;
1151                 struct ip_options_rcu *inet_opt;
1152
1153                 inet_opt = rcu_dereference_protected(inet->inet_opt,
1154                                                      sock_owned_by_user(sk));
1155                 opt->optlen = 0;
1156                 if (inet_opt)
1157                         memcpy(optbuf, &inet_opt->opt,
1158                                sizeof(struct ip_options) +
1159                                inet_opt->opt.optlen);
1160                 release_sock(sk);
1161
1162                 if (opt->optlen == 0)
1163                         return put_user(0, optlen);
1164
1165                 ip_options_undo(opt);
1166
1167                 len = min_t(unsigned int, len, opt->optlen);
1168                 if (put_user(len, optlen))
1169                         return -EFAULT;
1170                 if (copy_to_user(optval, opt->__data, len))
1171                         return -EFAULT;
1172                 return 0;
1173         }
1174         case IP_PKTINFO:
1175                 val = (inet->cmsg_flags & IP_CMSG_PKTINFO) != 0;
1176                 break;
1177         case IP_RECVTTL:
1178                 val = (inet->cmsg_flags & IP_CMSG_TTL) != 0;
1179                 break;
1180         case IP_RECVTOS:
1181                 val = (inet->cmsg_flags & IP_CMSG_TOS) != 0;
1182                 break;
1183         case IP_RECVOPTS:
1184                 val = (inet->cmsg_flags & IP_CMSG_RECVOPTS) != 0;
1185                 break;
1186         case IP_RETOPTS:
1187                 val = (inet->cmsg_flags & IP_CMSG_RETOPTS) != 0;
1188                 break;
1189         case IP_PASSSEC:
1190                 val = (inet->cmsg_flags & IP_CMSG_PASSSEC) != 0;
1191                 break;
1192         case IP_RECVORIGDSTADDR:
1193                 val = (inet->cmsg_flags & IP_CMSG_ORIGDSTADDR) != 0;
1194                 break;
1195         case IP_TOS:
1196                 val = inet->tos;
1197                 break;
1198         case IP_TTL:
1199                 val = (inet->uc_ttl == -1 ?
1200                        sysctl_ip_default_ttl :
1201                        inet->uc_ttl);
1202                 break;
1203         case IP_HDRINCL:
1204                 val = inet->hdrincl;
1205                 break;
1206         case IP_NODEFRAG:
1207                 val = inet->nodefrag;
1208                 break;
1209         case IP_MTU_DISCOVER:
1210                 val = inet->pmtudisc;
1211                 break;
1212         case IP_MTU:
1213         {
1214                 struct dst_entry *dst;
1215                 val = 0;
1216                 dst = sk_dst_get(sk);
1217                 if (dst) {
1218                         val = dst_mtu(dst);
1219                         dst_release(dst);
1220                 }
1221                 if (!val) {
1222                         release_sock(sk);
1223                         return -ENOTCONN;
1224                 }
1225                 break;
1226         }
1227         case IP_RECVERR:
1228                 val = inet->recverr;
1229                 break;
1230         case IP_MULTICAST_TTL:
1231                 val = inet->mc_ttl;
1232                 break;
1233         case IP_MULTICAST_LOOP:
1234                 val = inet->mc_loop;
1235                 break;
1236         case IP_UNICAST_IF:
1237                 val = (__force int)htonl((__u32) inet->uc_index);
1238                 break;
1239         case IP_MULTICAST_IF:
1240         {
1241                 struct in_addr addr;
1242                 len = min_t(unsigned int, len, sizeof(struct in_addr));
1243                 addr.s_addr = inet->mc_addr;
1244                 release_sock(sk);
1245
1246                 if (put_user(len, optlen))
1247                         return -EFAULT;
1248                 if (copy_to_user(optval, &addr, len))
1249                         return -EFAULT;
1250                 return 0;
1251         }
1252         case IP_MSFILTER:
1253         {
1254                 struct ip_msfilter msf;
1255                 int err;
1256
1257                 if (len < IP_MSFILTER_SIZE(0)) {
1258                         release_sock(sk);
1259                         return -EINVAL;
1260                 }
1261                 if (copy_from_user(&msf, optval, IP_MSFILTER_SIZE(0))) {
1262                         release_sock(sk);
1263                         return -EFAULT;
1264                 }
1265                 err = ip_mc_msfget(sk, &msf,
1266                                    (struct ip_msfilter __user *)optval, optlen);
1267                 release_sock(sk);
1268                 return err;
1269         }
1270         case MCAST_MSFILTER:
1271         {
1272                 struct group_filter gsf;
1273                 int err;
1274
1275                 if (len < GROUP_FILTER_SIZE(0)) {
1276                         release_sock(sk);
1277                         return -EINVAL;
1278                 }
1279                 if (copy_from_user(&gsf, optval, GROUP_FILTER_SIZE(0))) {
1280                         release_sock(sk);
1281                         return -EFAULT;
1282                 }
1283                 err = ip_mc_gsfget(sk, &gsf,
1284                                    (struct group_filter __user *)optval,
1285                                    optlen);
1286                 release_sock(sk);
1287                 return err;
1288         }
1289         case IP_MULTICAST_ALL:
1290                 val = inet->mc_all;
1291                 break;
1292         case IP_PKTOPTIONS:
1293         {
1294                 struct msghdr msg;
1295
1296                 release_sock(sk);
1297
1298                 if (sk->sk_type != SOCK_STREAM)
1299                         return -ENOPROTOOPT;
1300
1301                 msg.msg_control = optval;
1302                 msg.msg_controllen = len;
1303                 msg.msg_flags = flags;
1304
1305                 if (inet->cmsg_flags & IP_CMSG_PKTINFO) {
1306                         struct in_pktinfo info;
1307
1308                         info.ipi_addr.s_addr = inet->inet_rcv_saddr;
1309                         info.ipi_spec_dst.s_addr = inet->inet_rcv_saddr;
1310                         info.ipi_ifindex = inet->mc_index;
1311                         put_cmsg(&msg, SOL_IP, IP_PKTINFO, sizeof(info), &info);
1312                 }
1313                 if (inet->cmsg_flags & IP_CMSG_TTL) {
1314                         int hlim = inet->mc_ttl;
1315                         put_cmsg(&msg, SOL_IP, IP_TTL, sizeof(hlim), &hlim);
1316                 }
1317                 if (inet->cmsg_flags & IP_CMSG_TOS) {
1318                         int tos = inet->rcv_tos;
1319                         put_cmsg(&msg, SOL_IP, IP_TOS, sizeof(tos), &tos);
1320                 }
1321                 len -= msg.msg_controllen;
1322                 return put_user(len, optlen);
1323         }
1324         case IP_FREEBIND:
1325                 val = inet->freebind;
1326                 break;
1327         case IP_TRANSPARENT:
1328                 val = inet->transparent;
1329                 break;
1330         case IP_MINTTL:
1331                 val = inet->min_ttl;
1332                 break;
1333         default:
1334                 release_sock(sk);
1335                 return -ENOPROTOOPT;
1336         }
1337         release_sock(sk);
1338
1339         if (len < sizeof(int) && len > 0 && val >= 0 && val <= 255) {
1340                 unsigned char ucval = (unsigned char)val;
1341                 len = 1;
1342                 if (put_user(len, optlen))
1343                         return -EFAULT;
1344                 if (copy_to_user(optval, &ucval, 1))
1345                         return -EFAULT;
1346         } else {
1347                 len = min_t(unsigned int, sizeof(int), len);
1348                 if (put_user(len, optlen))
1349                         return -EFAULT;
1350                 if (copy_to_user(optval, &val, len))
1351                         return -EFAULT;
1352         }
1353         return 0;
1354 }
1355
1356 int ip_getsockopt(struct sock *sk, int level,
1357                   int optname, char __user *optval, int __user *optlen)
1358 {
1359         int err;
1360
1361         err = do_ip_getsockopt(sk, level, optname, optval, optlen, 0);
1362 #ifdef CONFIG_NETFILTER
1363         /* we need to exclude all possible ENOPROTOOPTs except default case */
1364         if (err == -ENOPROTOOPT && optname != IP_PKTOPTIONS &&
1365                         !ip_mroute_opt(optname)) {
1366                 int len;
1367
1368                 if (get_user(len, optlen))
1369                         return -EFAULT;
1370
1371                 lock_sock(sk);
1372                 err = nf_getsockopt(sk, PF_INET, optname, optval,
1373                                 &len);
1374                 release_sock(sk);
1375                 if (err >= 0)
1376                         err = put_user(len, optlen);
1377                 return err;
1378         }
1379 #endif
1380         return err;
1381 }
1382 EXPORT_SYMBOL(ip_getsockopt);
1383
1384 #ifdef CONFIG_COMPAT
1385 int compat_ip_getsockopt(struct sock *sk, int level, int optname,
1386                          char __user *optval, int __user *optlen)
1387 {
1388         int err;
1389
1390         if (optname == MCAST_MSFILTER)
1391                 return compat_mc_getsockopt(sk, level, optname, optval, optlen,
1392                         ip_getsockopt);
1393
1394         err = do_ip_getsockopt(sk, level, optname, optval, optlen,
1395                 MSG_CMSG_COMPAT);
1396
1397 #ifdef CONFIG_NETFILTER
1398         /* we need to exclude all possible ENOPROTOOPTs except default case */
1399         if (err == -ENOPROTOOPT && optname != IP_PKTOPTIONS &&
1400                         !ip_mroute_opt(optname)) {
1401                 int len;
1402
1403                 if (get_user(len, optlen))
1404                         return -EFAULT;
1405
1406                 lock_sock(sk);
1407                 err = compat_nf_getsockopt(sk, PF_INET, optname, optval, &len);
1408                 release_sock(sk);
1409                 if (err >= 0)
1410                         err = put_user(len, optlen);
1411                 return err;
1412         }
1413 #endif
1414         return err;
1415 }
1416 EXPORT_SYMBOL(compat_ip_getsockopt);
1417 #endif