Bài giảng Lý thuyết Xác suất và Thống kê Toán
ĐẠI HỌC DUY TÂN KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN XÁC SUẤT THỐNG KÊ
BÀI GIẢNG LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN (Lưu hành nội bộ)
Đà Nẵng, năm 2018
ĐẠI HỌC DUY TÂN KHOA KHOA HỌC TỰ NHIÊN BỘ MÔN XÁC SUẤT THỐNG KÊ
TỔ XÁC SUẤT THỐNG KÊ Chủ biên: NGUYỄN ĐẮC NHÂN
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ
Khoa: KHOA HỌC TỰ NHIÊN
Đà Nẵng, năm 2018
MỤC LỤC
Trang phụ bìa
Mục lục
Chương 1 Bản chất của xác suất thống kê
1.1 Thống kê mô tả và thống kê suy diễn
1.2 Các loại biến và các loại dữ liệu
1.2.1 Biến định tính và biến định lượng
1.2.2 Các loại thang đo thường được sử dụng
1.3 Thu thập dữ liệu và phương pháp lấy mẫu
1.3.1 Mẫu ngẫu nhiên (Random Sampling)
1.3.2 Mẫu hệ thống (Systematic Sampling)
1.3.3 Mẫu phân tầng (Stratified Sampling)
1.3.4 Mẫu chùm (Cluster Sampling)
1.4 Nghiên cứu quan sát và thực nghiệm
1.4.1 Nghiên cứu quan sát
1.4.2 Nghiên cứu thực nghiệm
1.5 Lợi ích và lạm dụng của thống kê
1.6 Máy tính và tính toán
Chương 2 Phân bố tần số và đồ thị
2.1 Tổ chức dữ liệu
2.2 Nhật đồ, đa giác tần số, hình cung
2.2.1 Nhật đồ
2.2.2 Đa giác tần số
2.2.3 Hình cung (Ogive)
2.2.4 Biểu đồ tần số tương đối
2.2.5 Các dạng phân phối
2.3 Một số loại biểu đồ khác
2.3.1 Biểu đồ thanh (Bar graph)
2.3.2 Biểu đồ Pareto
2.3.3 Biểu đồ chuỗi thời gian (Time series graph)
2.3.4 Biểu đồ hình tròn (Pie graph)
2.3.5 Biểu đồ gây nhầm lẫn
2.3.6 Biểu đồ thân và lá (Stem and Leaf Plots)
Chương 3 Mô tả dữ liệu
3.1 Các đo lường khuynh hướng định tâm (measures of central tendency)
3.1.1 Trung bình (mean)
3.1.2 Trung vị (median)
3.1.3 Mode
3.1.4 Trung bình khoảng (midrange)
3.2 Các thước đo về độ biến thiên (measures of variation)
3.2.1 Khoảng biến thiên (range)
3.2.2 Phương sai và độ lệch chuẩn (variance and standard deviation)
3.2.3 Hệ số biến thiên (coefficient of variation)
3.2.4 Quy tắc tính rợ khoảng (range rule of thumb)
3.2.5 Định lý Chebyshev
3.2.6 Quy tắc kinh nghiệm (empirical rule)
3.3 Các thước đo về vị trí (measures of position)
3.3.1 Điểm chuẩn (standard score)
3.3.2 Điểm bách phân (percentile)
3.3.3 Điểm thập phân và tứ phân (decile and quartile)
3.3.4 Giá trị ngoại biên hay cá biệt (outlier )
3.4 Phân tích dữ liệu khám phá (exploratory data analysis)
Chương 4 Xác suất và các quy tắc đếm
4.1 Không gian mẫu và xác suất
4.1.1 Các khái niệm cơ bản
4.1.2 Xác suất cổ điển
4.1.3 Biến cố đối
4.1.4 Xác suất thực nghiệm (empirical probability)
4.1.5 Luật số lớn
4.1.6 Xác suất chủ quan
4.2 Quy tắc cộng xác suất
4.3 Quy tắc nhân xác suất và xác suất có điều kiện
4.3.1 Quy tắc nhân xác suất
4.3.2 Xác suất có điều kiện
4.4 Các quy tắc đếm
4.4.1 Các quy tắc đếm cơ bản
4.4.2 Các khái niệm cơ bản về giải tích tổ hợp
4.4.3 Xác suất và quy tắc đếm
Chương 5 Phân phối xác suất rời rạc
5.1 Phân phối xác suất
5.2 Trung bình, phương sai, độ lệch chuẩn, kỳ vọng của một phân phối xác suất
5.2.1 Trung bình của một phân phối xác suất
5.2.2 Phương sai và độ lệch chuẩn của một phân phối xác suất
5.2.3 Kỳ vọng của một phân phối xác suất
5.3 Phân phối nhị thức
5.4 Các loại phân phối khác
5.4.1 Phân phối đa thức
5.4.2 Phân phối Poisson
5.4.3 Phân phối siêu bội (hypergeometric distribution)
Chương 6 Phân phối chuẩn
6.1 Phân phối chuẩn
6.2 Các ứng dụng của phân phối chuẩn
6.2.1 Tìm giá trị dữ liệu được cho bởi xác suất cụ thể
6.2.2 Xác định tính chuẩn
6.3 Định lý giới hạn trung tâm
6.3.1 Phân phối của trung bình mẫu
6.3.2 Thừa số điều chỉnh hữu hạn
6.4 Phép tiệm cận chuẩn cho phân phối nhị thức
Chương 7 Khoảng tin cậy và cỡ mẫu
7.1 Khoảng tin cậy cho trung bình khi biết σ và cỡ mẫu
7.2 Khoảng tin cậy cho trung bình khi không biết σ
7.2.1 Độ lệch chuẩn tổng thể σ chưa biết, kích thước mẫu n ≥ 30
7.2.2 Độ lệch chuẩn tổng thể σ chưa biết, kích thước mẫu n < 30, X tuân theo phân phối chuẩn
7.3 Khoảng tin cậy và cỡ mẫu cho tỷ lệ
7.4 Khoảng tin cậy cho phương sai và độ lệch chuẩn
Chương 8 Kiểm định giả thuyết thống kê
8.1 Thủ tục kiểm định giả thuyết – phương pháp truyền thống
8.2 Kiểm định Z cho giá trị trung bình
8.3 Kiểm định T cho giá trị trung bình
8.4 kiểm định Z cho tỉ lệ
8.5 Kiểm định χ2 cho phương sai và độ lệch chuẩn
8.6 Các chủ đề khác liên quan đến kiểm định giả thuyết
8.6.1 Khoảng tin cậy và kiểm định giả thuyết
8.6.2 Sai lầm loại II và lực kiểm định
Chương 9 Tương quan và hồi quy
9.1 Đồ thị với các điểm chấm (scatter plots) và tương quan (correlation)
9.2 Hồi quy (regression)
9.2.1 Đường hồi quy
9.2.2 Xác định phương trình đường hồi quy
9.3 Hệ số quyết định và sai số chuẩn tiên đoán
9.3.1 Các loại biến cho mô hình hồi quy
9.3.2 Hệ số quyết định (coefficient of determination)
9.3.3 Sai số tiêu chuẩn tiên đoán (standard error of the estimate)
9.3.4 Khoảng tiên đoán (prediction interval )
9.4 Hồi quy bội
9.4.1 Phương trình hồi quy bội
9.4.2 Kiểm định ý nghĩa của R
9.4.3 Điều chỉnh R2
PHỤ LỤC
TÀI LIỆU THAM KHẢO
Chương 1 BẢN CHẤT CỦA XÁC SUẤT THỐNG KÊ
Thống kê là khoa học nghiên cứu của tập hợp nhiều lĩnh vực khác nhau, bao gồm thu thập, tổ chức, tổng hợp, phân tích và rút ra kết luận từ dữ liệu. Một vài lý do mà sinh viên học sinh cần học thống kê là:
- Giống như những người chuyên nghiệp, bạn phải có khả năng đọc và hiểu các nghiên cứu thống kê được thực hiện trong các lĩnh vực của bạn. Để có được sự hiểu biết này, bạn phải am hiểu về từ vựng, các kí hiệu, khái niệm, và thủ tục thống kê được sử dụng trong các nghiên cứu này.
- Bạn có thể được giao để tiến hành các nghiên cứu trong lĩnh vực của bạn, vì thủ tục thống kê là cơ bản để tiến hành một nghiên cứu. Để thực hiện việc này, bạn phải có khả năng thiết kế các thí nghiệm, thu thập, tổ chức, phân tích và tóm tắt dữ liệu và có thể đưa ra dự đoán đáng tin cậy hoặc dự báo để sử dụng trong tương lai. Bạn cũng phải có khả năng truyền đạt kết quả nghiên cứu bằng khả năng diễn đạt của bạn.
- Bạn cũng có thể sử dụng các kiến thức thu được từ nghiên cứu thống kê để trở thành người tiêu dùng và công dân tốt hơn. Ví dụ: bạn có thể đưa ra các quyết định thông minh về sản phẩm cần mua dựa trên nghiên cứu người tiêu dùng, về chi tiêu của chính phủ dựa trên nghiên cứu sử dụng,...
Những lý do này có thể được coi là mục tiêu để nghiên cứu số liệu thống kê. Mục đích của chương này là giới thiệu các mục tiêu nghiên cứu thống kê bằng việc trả lời các câu hỏi như sau: Thống kê là gì? Dữ liệu là gì? Các mẫu được chọn như thế nào? Sau khi học xong chương này, người học sẽ được cung cấp về những điều sau:
- Kiểm tra được kiến thức về các thuật ngữ thống kê.
- Phân biệt được giữa hai nhánh của thống kê: Thống kê mô tả và thống kê suy diễn.
- Xác định được các loại dữ liệu.
- Xác định mức đo lường cho mỗi biến.
- Xác định bốn kỹ thuật lấy mẫu căn bản.
- Giải thích sự khác nhau giữa nghiên cứu quan sát và nghiên cứu thực nghiệm.
- Giải thích cách mà thống kê có thể được sử dụng và sự lạm dụng của thống kê.
- Giải thích tầm quan trọng của máy tính và tính toán trong thống kê.
1.1 Thống kê mô tả và thống kê suy diễn
Để có được các kiến thức về những tình huống dường như ngẫu nhiên, thống kê thu thập thông tin cho các biến, mô tả tình hình. Một biến là một đặc điểm hay thuộc tính có thể cho giá trị khác nhau. Dữ liệu là tập các giá trị (số đo hoặc quan sát) mà các biến có thể giả định. Biến có giá trị được xác định ngẫu nhiên được gọi là biến ngẫu nhiên. Tập các giá trị dữ liệu tạo thành một tập hợp giá trị dữ liệu. Mỗi giá trị dữ liệu thiết lập được gọi là một giá trị dữ liệu hoặc một số liệu. Thống kê thường được chia ra hai loại là thống kê mô tả và thống kê suy diễn:
- Thống kê mô tả được sử dụng để mô tả một nhóm phần tử được quan sát trong thực tế. Thống kê mô tả bao gồm thu thập, tổ chức, tổng hợp và trình bày dữ liệu.
- Thông thường trong nghiên cứu, ta không chỉ giới hạn các kết luận vào một nhóm các phần tử mà ta đã quan sát (được gọi là mẫu). Điều mà ta muốn là t


