Data khách hàng càng ngày càng trở nên quan trọng, việc phân tích dữ liệu cũng quan trọng không kém. Một trong những rắc rối gặp phải là việc data khách hàng bị trùng lặp. Dưới đây là cách Vietgear.vn xử lý data trùng lặp cực đơn giản.
Trường hợp dữ liệu dễ dàng bị trùng lặp
Ví dụ bạn đang đi thu thập facebook ID của người dùng trong các nhóm liên quan đến bất động sản Vin, chung cư của Vin chẳng hạn, có khoảng 50 group liên quan, đương nhiên người dùng cũng tham gia rất nhiều nhóm.
Bạn quét thành viên nhóm để lấy UID thì đương nhiên 1 UID có thể ở nhiều nhóm cùng lúc, dẫn tới UID bị trùng khá nhiều, việc của chúng ta là cần loại bỏ các UID đó để tới các công đoạn tiếp theo.
Điều này tương tự với các ngành nghề lĩnh vực khác như hội cá cảnh, máy ảnh, spa…. Hầu hết các lĩnh vực đều có rất nhiều hội nhóm. Nên việc có một công cụ nhanh gọn nhẹ giúp bạn loại bỏ các dữ liệu trùng lặp hết sức cần thiết.
Loại bỏ dữ liệu trùng lặp với Remove Duplicate Lines
Link truy cập Remove Duplicate Line ở đây
Ngoài ra còn có rất nhiều công cụ khác như find and replace các bạn tùy ý lựa chọn
Cách thức hoạt động lọc dữ liệu trùng lặp
- Copy dữ liệu vào trường copy
- Lựa chọn option thêm là Remove Empty Lines ( xóa dòng trống )
- Lựa chọn Display remove ( hiển thị dòng bị xóa )
- Load file có sẵn hoặc save dữ liệu đã lọc về máy
Trên đây là cách lọc dữ liệu đơn giản, hiệu quả cho anh em xử lý data, nếu thấy hữu ích hãy để lại comment để anh em Vietgear.vn tìm thêm nhiều tiện ích cho anh em nhé.