Slide
5. Bai giang mon hoc.rar
Bai tap 1
BT1.doc
Bai Tap Phan Lop
BaiTapPhanLop.rar
Danh sach nhom:
DSNhom_DataMining_ChieuThu6.xlsx
Lớp học bù chiều thứ 3 ngày 05/04/2016 tại phòng máy 1,2
Lớp học bù chiều thứ 3 ngày 12/04/2016 tại phòng máy A5-303
Thứ sáu ngày 15/04 lớp thi vấn đáp phần code thuật toán cây quyết định: Gain, GainRatio và thuật toán xác xuất: Bayesian.
Nội dung: Code
Nên làm giao diện, cho phép nhập dữ liệu bằng file hoặc thêm một số bộ dữ liệu bằng tay.
Mỗi thuật toán ứng với một nút lệnh
Quá trình tiền xử lý cần được đưa ra dạng tự chọn (option) càng nhiều càng tốt. Ví dụ: Độ tuổi chẳng hạng. Bạn nên cho họ tạo các dạng : Trung tiên, cao niên, thanh tiên.... và ứng với mỗi loại như thế, bạn nên cho người dùng tự gán đoạn giá trị. Ví dụ: 28-45 là trung niên chẳng hạng....
Kết quả cây quyết định nên xuất ra thành luật. Không nên vẽ cây vì sẽ tốn nhiều thời gian (nếu nhóm nào vẽ cây thì sẽ được cộng thêm điểm)
Các kết quả trung gian nên được thể hiện một cách cụ thể từ công thức đến kết quả. Càng chi tiết phần này càng được đánh giá cao.
Ngôn ngữ sử dụng: Tùy ý.
Đảm bảo các thành viên phải tham gia. GV sẽ hỏi bất kỳ người nào, bất kỳ chỗ nào trong code mà không trả lời được thì xem như là không làm và sẽ bị đánh giá là không đạt.
Chúc các bạn làm tốt.
ĐIểm cập nhập ngày 16/04/2016
DSDiemDanh_152DAMI330484_02.xls
Các nhóm còn lại báo cáo ngày 22/04/2016, thứ 6 tiết 11-12 phòng A4-303.
Điểm giũa kỳ cuối cùng cập nhập ngày 11/05/2016.
DSDiemDanh_152DAMI330484_02.xls
Khiếu nại qua mail đến hết ngày 13/06/2016.
Bài tập Clustering.
BaiTapCluster.rar
Yêu cầu Code Cluster K-mean
-
Cho phép nhập nhiều loại dữ liệu khác nhau
-
Cho phép gán các loại biến cho các cột dữ liệu. Ví dụ, khi thì gán là Ordinal, khi có thể gán là Categorical cho một cột dữ liệu.
-
Cho phép chuẩn hóa dữ liệu (tính z, log…) theo các biến đã được chọn tương ứng với các cột dữ liệu
-
Cho phép chọn số cụm K = 2, 4,6,5….
-
Cho phép chọn ngẫu nhiên K phần tử dữ liệu ban đầu làm tâm các cụm. Thêm vào đó, cho phép gán cố định giá trị tâm để test dữ liệu của bài tính tay.
-
Cho phép nhập số lần lặp. Ví dụ n=4 thì tối đa lặp 4 lần và thông báo số cụm sau 4 lần lặp. Nếu n=0 thì cho phép lặp đến khi không có sự thay đổi thì dừng
-
Các kết quả trung gian của các bước lặp cần được thể hiện rõ (Cái này quan trọng)
Thứ sáu ngày 20/05 học 6 tiết T7-12 tại phòng máy A5-203 (Nội dung: hỗ trợ và hướng dẫn code, test K-mean)
Lịch thi:
ngày 4/06/2016 Ca1,2 (7h) tại phòng máy 1,2