unsigned char pad; /* make dev_addr aligned to 8 bytes */ unsigned char dev_addr[MAX_ADDR_LEN]; /* hw address */
unsigned char addr_len; /* hardware address length */
unsigned long pa_addr; /* protocol address */
unsigned long pa_brdaddr; /* protocol broadcast addr */
unsigned long pa_dstaddr; /* protocol P-P other side addr */
unsigned long pa_mask; /* protocol netmask */
unsigned short pa_alen; /* protocol address length */
struct dev_mc_list *mc_list; /* Multicast mac addresses */
int mc_count; /* Number of installed mcasts */
struct ip_mc_list *ip_mc_list; /* IP multicast filter chain */
__u32 tx_queue_len; /* Max frames per queue allowed */
------------------ Linux作業系統網路驅動程式編寫 ------------------- ------------ Contact the author by mailto:bordi@bordi.dhs.org ------
/* For load balancing driver pair support */
unsigned long pkt_queue; /* Packets queued */ struct device *slave; /* Slave device */ struct net_alias_info *alias_info; /* main dev alias info */ struct net_alias *my_alias; /* alias devs */
/* Pointer to the interface buffers. */ struct sk_buff_head buffs[DEV_NUMBUFFS];
/* Pointers to interface service routines. */ int (*open)(struct device *dev); int (*stop)(struct device *dev); int (*hard_start_xmit) (struct sk_buff *skb, struct device *dev); int (*hard_header) (struct sk_buff *skb, struct device *dev, unsigned short type, void *daddr, void *saddr, unsigned len); int (*rebuild_header)(void *eth, struct device *dev,
unsigned long raddr, struct sk_buff *skb);
#define HAVE_MULTICAST void (*set_multicast_list)(struct device *dev); #define HAVE_SET_MAC_ADDR int (*set_mac_address)(struct device *dev, void *addr); #define HAVE_PRIVATE_IOCTL int (*do_ioctl)(struct device *dev, struct ifreq *ifr, int cmd); #define HAVE_SET_CONFIG int (*set_config)(struct device *dev, struct ifmap *map); #define HAVE_HEADER_CACHE void (*header_cache_bind)(struct hh_cache **hhp, struct device *dev, unsigned short htype, __u32 daddr); void (*header_cache_update)(struct hh_cache *hh, struct device *dev, unsigned char * haddr); #define HAVE_CHANGE_MTU int (*change_mtu)(struct device *dev, int new_mtu);
struct iw_statistics* (*get_wireless_stats)(struct device *dev); };
2.4 常用的系統支援
2.4.1 記憶體申請和釋放 include/linux/kernel.h裏聲明了kmalloc()和kfree()。用於在內核模式下申 請和釋放記憶體。 void *kmalloc(unsigned int len,int priority); void kfree(void *__ptr); 與用戶模式下的malloc()不同,kmalloc()申請空間有大小限制。長度是2的整 次方。可以申請的最大長度也有限制。另外kmalloc()有priority參數,通常使用 時可以為GFP_KERNEL,如果在中斷裏調用用GFP_ATOMIC參數,因為使用GFP_KERNEL 則調用者可能進入sleep狀態,在處理中斷時是不允許的。 kfree()釋放的記憶體必須是kmalloc()申請的。如果知道記憶體的大小,也可以用 kfree_s()釋放。
2.4.2 request_irq()、free_irq() 這是驅動程式申請中斷和釋放中斷的調用。在include/linux/sched.h裏聲明。 request_irq()調用的定義: int request_irq(unsigned int irq, void (*handler)(int irq, void *dev_id, struct pt_regs *regs), unsigned long irqflags, const char * devname, void *dev_id); irq是要申請的硬體中斷號。在Intel平臺,範圍0--15。handler是向系統登記 的中斷處理函數。這是一個回調函數,中斷發生時,系統調用這個函數,傳入的參 數包括硬體中斷號,device id,寄存器值。dev_id就是下面的request_irq時傳遞 給系統的參數dev_id。irqflags是中斷處理的一些屬性。比較重要的有 SA_INTERRUPT, 標明中斷處理程式是快速處理程式(設置SA_INTERRUPT)還是慢速處理程式(不設置 SA_INTERRUPT)。快速處理程式被調用時遮罩所有中斷。慢速處理程式不遮罩。還有 一個SA_SHIRQ屬性,設置了以後運行多個設備共用中斷。dev_id在中斷共用時會用 到。一般設置為這個設備的device結構本身或者NULL。中斷處理程式可以用dev_id 找到相應的控制這個中斷的設備,或者用irq2dev_map找到中斷對應的設備。 void free_irq(unsigned int irq,void *dev_id);
2.4.3 時鐘 時鐘的處理類似中斷,也是登記一個時間處理函數,在預定的時間過後,系統 會調用這個函數。在include/linux/timer.h裏聲明。 struct timer_list { struct timer_list *next; struct timer_list *prev; unsigned long expires; unsigned long data; void (*function)(unsigned long); }; void add_timer(struct timer_list * timer); int del_timer(struct timer_list * timer); void init_timer(struct timer_list * timer); 使用時鐘,先聲明一個timer_list結構,調用init_timer對它進行初始化。 time_list結構裏expires是標明這個時鐘的週期,單位採用jiffies的單位。 jiffies是Linux一個總體變數,代表時間。它的單位隨硬體平臺的不同而不同。 系統裏定義了一個常數HZ,代表每秒種最小時間間隔的數目。這樣jiffies的單位 就是1/HZ。Intel平臺jiffies的單位是1/100秒,這就是系統所能分辨的最小時間 間隔了。所以expires/HZ就是以秒為單位的這個時鐘的週期。 function就是時間到了以後的回調函數,它的參數就是timer_list中的data。 data這個參數在初始化時鐘的時候賦值,一般賦給它設備的device結構指標。 在預置時間到系統調用function,同時系統把這個time_list從定時佇列裏清 除。所以如果需要一直使用定時函數,要在function裏再次調用add_timer()把這
------------------ Linux作業系統網路驅動程式編寫 ------------------- ------------ Contact the author by mailto:bordi@bordi.dhs.org ------
個timer_list加進定時佇列。
2.4.4 I/O I/O埠的存取使用: inline unsigned int inb(unsigned short port); inline unsigned int inb_p(unsigned short port); inline void outb(char value, unsigned short port); inline void outb_p(char value, unsigned short port); 在include/adm/io.h裏定義。 inb_p()、outb_p()與inb()、outb_p()的不同在於前者在存取I/O時有等待 (pause)一適應慢速的I/O設備。 為了防止存取I/O時發生衝突,Linux提供對埠使用情況的控制。在使用埠 之前,可以檢查需要的I/O是否正在被使用,如果沒有,則把埠標記為正在使用, 使用完後再釋放。系統提供以下幾個函數做這些工作。 int check_region(unsigned int from, unsigned int extent); void request_region(unsigned int from, unsigned int extent,const char *name); void release_region(unsigned int from, unsigned int extent); 其中的參數from表示用到的I/O埠的起始位址,extent標明從from開始的端 口數目。name為設備名稱。
2.4.5 中斷打開關閉 系統提供給驅動程式開放和關閉回應中斷的能力。是在include/asm/system.h 中的兩個定義。 #define cli() __asm__ __volatile__ ("cli"::) #define sti() __asm__ __volatile__ ("sti"::)
2.4.6 列印資訊 類似普通程式裏的printf(),驅動程式要輸出資訊使用printk()。在include /linux/kernel.h裏聲明。 int printk(const char* fmt, ...); 其中fmt是格式化字串。...是參數。都是和printf()格式一樣的。
2.4.7 註冊驅動程式 如果使用模組(module)方式載入驅動程式,需要在模組初始化時把設備註冊 到系統設備表裏去。不再使用時,把設備從系統中卸除。定義在 drivers/net/net_init.h 裏的兩個函數完成這個工作。 int register_netdev(struct device *dev); void unregister_netdev(struct device *dev); dev就是要註冊進系統的設備結構指標。在register_netdev()時,dev結構一 般填寫前面11項,即到init,後面的暫時可以不用初始化。最重要的是name指針和 init方法。name指標空(NULL)或者內容為\或者name[0]為空格(space),則系統 把你的設備做為乙太網設備處理。乙太網設備有統一的命名格式,ethX。對乙太網 這麼特別對待大概和Linux的歷史有關。 init方法一定要提供,register_netdev()會調用這個方法讓你對硬體檢測和 設置。 register_netdev()返回0表示成功,非0不成功。
2.4.8 sk_buff Linux網路各層之間的資料傳送都是通過sk_buff。sk_buff提供一套管理緩衝 區的方法,是Linux系統網路高效運行的關鍵。每個sk_buff包括一些控制方法和一 塊數據緩衝區。控制方法按功能分為兩種類型。一種是控制整個buffer鏈的方法, 另一種是控制資料緩衝區的方法。sk_buff組織成雙向鏈表的形式,根據網路應用 的特點,對鏈表的操作主要是刪除鏈表頭的元素和添加到鏈表尾。sk_buff的控制 方法都很短小以儘量減少系統負荷。(translated from article written by Alan Cox) 常用的方法包括: .alloc_skb() 申請一個sk_buff並對它初始化。返回就是申請到的sk_buff。 .dev_alloc_skb()類似alloc_skb,在申請好緩衝區後,保留16位元組的幀頭空 間。主要用在Ethernet驅動程式。 .kfree_skb() 釋放一個sk_buff。 .skb_clone() 複製一個sk_buff,但不複製資料部分。 .skb_copy()完全複製一個sk_buff。 .skb_dequeue() 從一個sk_buff鏈表裏取出第一個元素。返回取出的sk_buff, 如果鏈表空則返回NULL。這是常用的一個操作。 .skb_queue_head() 在一個sk_buff鏈表頭放入一個元素。 .skb_queue_tail() 在一個sk_buff鏈表尾放入一個元素。這也是常用的一個 操作。網路資料的處理主要是對一個先進先出佇列的管理,skb_queue_tail() 和skb_dequeue()完成這個工作。 .skb_insert() 在鏈表的某個元素前插入一個元素。 .skb_append() 在鏈表的某個元素後插入一個元素。一些協議(如TCP)對沒按 順序到達的資料進行重組時用到skb_insert()和skb_append()。
.skb_reserve() 在一個申請好的sk_buff的緩衝區裏保留一塊空間。這個空間 一般是用做下一層協定的頭空間的。 .skb_put() 在一個申請好的sk_buff的緩衝區裏為資料保留一塊空間。在 alloc_skb以後,申請到的sk_buff的緩衝區都是處於空(free)狀態,有一個 tail指標指向free空間,實際上開始時tail就指向緩衝區頭。skb_reserve() 在free空間裏申請協定頭空間,skb_put()申請資料空間。見下麵的圖。 .skb_push() 把sk_buff緩衝區裏資料空間往前移。即把Head room中的空間移 一部分到Data area。 .skb_pull() 把sk_buff緩衝區裏Data area中的空間移一部分到Head room中。
-------------------------------------------------- | Tail room(free) | -------------------------------------------------- After alloc_skb()
-------------------------------------------------- | Head room | Tail room(free) | -------------------------------------------------- After skb_reserve()
-------------------------------------------------- | Head room | Data area | Tail room(free) | -------------------------------------------------- After skb_put()
-------------------------------------------------- |Head| skb_ | Data | Tail room(free) | |room| push | | | | | Data area | | -------------------------------------------------- After skb_push()
-------------------------------------------------- | Head | skb_ | Data area | Tail room(free) | | | pull | | | | Head room | | | -------------------------------------------------- After skb_pull()
------------------ Linux作業系統網路驅動程式編寫 ------------------- ------------ Contact the author by mailto:bordi@bordi.dhs.org ------
三.編寫Linux網路驅動程式中需要注意的問題
3.1 中斷共用 Linux系統運行幾個設備共用同一個中斷。需要共用的話,在申請的時候指明 共用方式。系統提供的request_irq()調用的定義: int request_irq(unsigned int irq, void (*handler)(int irq, void *dev_id, struct pt_regs *regs), unsigned long irqflags, const char * devname, void *dev_id); 如果共用中斷,irqflags設置SA_SHIRQ屬性,這樣就允許別的設備申請同一個 中斷。需要注意所有用到這個中斷的設備在調用request_irq()都必須設置這個屬 性。系統在回調每個中斷處理程式時,可以用dev_id這個參數找到相應的設備。一 般dev_id就設為device結構本身。系統處理共用中斷是用各自的dev_id參數依次調 用每一個中斷處理程式。
3.2 硬體發送忙時的處理 主CPU的處理能力一般比網路發送要快,所以經常會遇到系統有資料要發,但 上一包資料網路設備還沒發送完。因為在Linux裏網路設備驅動程式一般不做資料 緩存,不能發送的資料都是通知系統發送不成功,所以必須要有一個機制在硬體不 忙時及時通知系統接著發送下面的資料。 一般對發送忙的處理在前面設備的發送方法(hard_start_xmit)裏已經描述過, 即如果發送忙,置tbusy為1。處理完發送資料後,在發送結束中斷裏清tbusy,同 時用mark_bh()調用通知系統繼續發送。 但在具體實現我的驅動程式時發現,這樣的處理系統好象並不能及時地知道硬 件已經空閒了,即在mark_bh()以後,系統要等一段時間才會接著發送。造成發送 效率很低。2M線路只有10%不到的使用率。內核版本為2.0.35。 我最後的實現是不把tbusy置1,讓系統始終認為硬體空閒,但是報告發送不成 功。系統會一直嘗試重發。這樣處理就運行正常了。但是遍循內核源碼中的網路驅 動程式,似乎沒有這樣處理的。不知道癥結在哪里。
3.3 流量控制(flow control) 網路資料上一页 [1] [2] [3] 下一页 |