Pandaslà một thư viện Python hỗ trợ các kết cấu dữ liệu nhanh, bạo dạn mẽ, linh hoạt. Pandas được thiết kế với để có tác dụng việcdễ dàng cùng trực quan với tài liệu có cấu trúc (dạng bảng, nhiều chiều, ko đồng nhất) và tài liệu chuỗi thời gian.
Bạn đang xem: Thư viện pandas
Vì sao chúng ta nên sử dụng Pandas?
Pandas rấtphù phù hợp với nhiều loại dữ liệu khác nhau:
- dữ liệu dạng bảng với các cột được nhập không đồng nhất, như trong bảng SQL hoặc bảng tính Excel.
- tài liệu chuỗi thời hạn theo sản phẩm tự và không tồn tại thứ từ bỏ (không tuyệt nhất thiết phải bao gồm tần số cầm định).
- dữ liệu ma trận tùy ý (được nhập nhất quán hoặc không đồng nhất) cùng với nhãn hàng với cột.Bất kỳ hình thức khác của những bộ tài liệu quan cạnh bên / thống kê.
- tài liệu thực sự không cần thiết phải được dán nhãn vào cấu trúc dữ liệu pandas.Pandas được chế tạo dựa trên
Num
Py.
- Hai kết cấu dữ liệu bao gồm của pandas là
Series(1 chiều) và
Data
Frame(2 chiều) giải pháp xử lý được đa số các ngôi trường hợp điển hình trong tài chính, thống kê, công nghệ xã hội và nhiều nghành kỹ thuật.
Xem thêm: Thư viện matplotlib là gì - vẽ biểu đồ với thư viện matplotlib (phần 1)
Ưu điểm của pandas:
- thuận tiện xử lý tài liệu mất mát, được biểu lộ dưới dạng Na
N, trong tài liệu dấu phẩy động cũng như dấu phẩy tĩnh theo ý người dùng mong muốn: bỏ qua mất hoặc đưa sang 0
- Khả năng đổi khác kích thước: các cột rất có thể được chèn và xóa khỏi Data
Frame cùng các đối tượng người sử dụng chiều cao hơn
- căn chỉnh dữ liệu auto và rõ ràng: các đối tượng hoàn toàn có thể được chỉnh sửa rõ ràng với một cỗ nhãn hoặc fan dùng chỉ cần bỏ qua những nhãn và để
Series,Data
Frame,v.v. Tự động hóa căn chỉnh dữ liệu cho chính mình trong các tính toán.
- các công nuốm IO mạnh khỏe để tải tài liệu từ các tệp phẳng (flat file) như CSV và delimited, tệp Excel, cơ sở dữ liệu và lưu / tải tài liệu từ định dạng HDF5 cực nhanh
- Gộp (merging) và nối (joining) những tập dữ liệu trực quan
2. Làm quen với Pandas cùng Data
Frame
Chúng ta sẽ cũng so với một data hiểu hiểu rõ hơn về thư viện Pandas và các lệnh trong Pandas bằng Jupyter Note
Book.
Nếu bạn chưa chắc chắn cách sử dụng Jupyter Notebook hãy xem lại tại đây.
Bước 1: Thêm thư viện
Để áp dụng được thư viện các các bạn sẽ phải thêm thư viện bởi lệnh “import”
Bước 2: Import Dataset
Pandas sẽ hỗ trợ bạn làm việc với các định dạng không giống nhau như: excel, csv, word,….
Để phát âm file các các bạn sẽ sử dụng những lệnh như mặt dưới.