Phân tích kỹ thuật về Fitdata: Hướng tới xây dựng cơ sở dữ liệu phụ tùng xe máy được tiêu chuẩn hóa
Ngành công nghiệp xe máy cung cấp phương tiện di chuyển thiết yếu cho hàng triệu người trên toàn thế giới và đang có sự tăng trưởng bùng nổ, đặc biệt là ở các thị trường mới nổi như Đông Nam Á. Tuy nhiên, đằng sau sự tăng trưởng về số lượng này là những vấn đề cấu trúc đã tồn tại từ lâu chưa được giải quyết. Đó chính là sự phân mảnh của dữ liệu và thiếu các tiêu chuẩn. Đặc biệt, hơn 99,9% dữ liệu về phụ tùng và bảo dưỡng, vốn đóng vai trò cốt lõi trong toàn bộ vòng đời của xe máy, đang nằm rải rác ở dạng ngoại tuyến và được quản lý mà không có một hệ thống bài bản. Điều này dẫn đến việc bảo dưỡng không hiệu quả, sự thiếu minh bạch của thị trường xe cũ do thông tin bất đối xứng, và là nguyên nhân chính cản trở tiềm năng tăng trưởng của toàn ngành.
Xuất phát từ nhận thức về vấn đề này, Fitdata, một công ty khởi nghiệp của Hàn Quốc, đang dẫn đầu quá trình chuyển đổi số của ngành bằng cách phát triển một nền tảng quản lý vòng đời xe máy dựa trên công nghệ trí tuệ nhân tạo (AI). Mục tiêu cốt lõi của Fitdata là thu thập và tinh chỉnh dữ liệu phân mảnh để xây dựng một cơ sở dữ liệu phụ tùng xe máy được tiêu chuẩn hóa. Báo cáo phân tích kỹ thuật này nhằm mục đích phân tích sâu về cách tiếp cận kỹ thuật mà Fitdata đang thực hiện để đạt được mục tiêu này và những đổi mới mà giải pháp của họ có thể mang lại cho ngành công nghiệp xe máy.

Thực trạng thị trường phụ tùng xe máy: Biển dữ liệu phân mảnh
Thị trường phụ tùng xe máy hiện nay là một lĩnh vực mà hiện tượng ‘silo dữ liệu’ (data silo) diễn ra cực kỳ nghiêm trọng. Với vô số nhà sản xuất, kiểu máy và năm sản xuất, các loại và thông số kỹ thuật của phụ tùng rất đa dạng, và nếu tính cả các phụ tùng tương thích và thay thế, sự phức tạp sẽ tăng lên theo cấp số nhân. Tại các cửa hàng sửa chữa, việc xác định và đặt hàng phụ tùng chủ yếu dựa vào kinh nghiệm của các thợ sửa chữa lành nghề, điều này thường dẫn đến lãng phí thời gian và chi phí do đặt sai phụ tùng. Người tiêu dùng cũng khó có thể biết chính xác những phụ tùng nào đã được sử dụng trên xe của mình hay lịch sử bảo dưỡng ra sao.
Sự phân mảnh dữ liệu này gây ra các vấn đề cụ thể sau:
- Quản lý tồn kho không hiệu quả: Các cửa hàng sửa chữa và nhà cung cấp phụ tùng gặp khó khăn trong việc dự báo nhu cầu chính xác, dẫn đến tình trạng tồn kho quá nhiều hoặc thiếu hụt.
- Thông tin bất đối xứng: Khi giao dịch xe máy cũ, người mua không thể biết lịch sử bảo dưỡng chính xác hoặc chi tiết thay thế phụ tùng của xe, gây ra vấn đề ‘Thị trường quả chanh’ (Lemon Market).
- Cản trở sự phát triển công nghệ: Nếu không có dữ liệu được tiêu chuẩn hóa, rất khó để giới thiệu các mô hình dịch vụ mới dựa trên dữ liệu như bảo dưỡng dự đoán, phát triển các sản phẩm bảo hiểm tùy chỉnh.
Fitdata đã chẩn đoán rằng nguyên nhân sâu xa của những vấn đề này nằm ở sự thiếu hụt một hệ thống thu thập và quản lý dữ liệu có hệ thống. Và họ đề xuất giải pháp là công nghệ cấu trúc hóa dữ liệu tự động sử dụng công nghệ AI, đặc biệt là xử lý ngôn ngữ tự nhiên (NLP) và nhận dạng ký tự quang học (OCR).

Công nghệ cốt lõi của Fitdata: Tiêu chuẩn hóa dữ liệu bằng AI
Sự đổi mới kỹ thuật của Fitdata bắt đầu từ công nghệ ‘cấu trúc hóa tự động bảng kê chi tiết sửa chữa’. Đây là công nghệ nhận dạng và trích xuất tự động văn bản và dữ liệu bên trong các bảng kê chi tiết sửa chữa được viết tay hoặc in ra theo các định dạng khác nhau tại các cửa hàng sửa chữa, sau đó chuyển đổi chúng thành dữ liệu kỹ thuật số có cấu trúc. Quá trình này được chia thành hai giai đoạn chính.
1. Nhận dạng ký tự quang học (OCR)
Fitdata sử dụng công cụ OCR tự phát triển để trích xuất văn bản với độ chính xác cao từ hình ảnh của các loại bảng kê chi tiết sửa chữa khác nhau. Trong khi công nghệ OCR phổ thông hiện có được tối ưu hóa cho các tài liệu có cấu trúc, OCR của Fitdata cho thấy hiệu suất vượt trội ngay cả trong môi trường không điển hình của các bảng kê chi tiết sửa chữa, chẳng hạn như chữ viết tay, các kiểu chữ in đa dạng và cấu trúc bảng phức tạp. Fitdata cho biết điểm F1-score (trung bình hài hòa của độ chính xác và độ bao phủ) của OCR đạt 92%, đây là mức độ chính xác đủ để sử dụng trong môi trường công nghiệp thực tế.
2. Xử lý ngôn ngữ tự nhiên (NLP)
Văn bản được trích xuất thông qua OCR chỉ là một chuỗi các ký tự. Fitdata áp dụng công nghệ NLP vào đây để phân tích và phân loại ý nghĩa của mỗi văn bản (ví dụ: số khung, tên phụ tùng, nội dung công việc, chi phí, v.v.). Đặc biệt, công nghệ cốt lõi là hiểu các thuật ngữ lóng, viết tắt và không chuẩn mà các thợ sửa chữa sử dụng và chuyển đổi chúng thành tên phụ tùng hoặc tên công việc được tiêu chuẩn hóa. Ví dụ, ngay cả khi công việc ‘thay dầu động cơ’ được thể hiện theo nhiều cách khác nhau như ‘thay E/O’, ‘thay nhớt’, mô hình NLP sẽ nhận ra tất cả chúng là cùng một mã công việc tiêu chuẩn và ánh xạ chúng. Thông qua đó, dữ liệu bảo dưỡng cuối cùng cũng trở thành dạng mà máy có thể đọc và phân tích (machine-readable).
Thông qua sự kết hợp của hai công nghệ này, Fitdata chuyển đổi một lượng lớn dữ liệu bảo dưỡng đang ngủ yên ở dạng ngoại tuyến thành tài sản kỹ thuật số và lấy đó làm nền tảng cho cơ sở dữ liệu phụ tùng được tiêu chuẩn hóa.

Xây dựng cơ sở dữ liệu phụ tùng tiêu chuẩn: Thách thức kỹ thuật và giải pháp
Quá trình xây dựng cơ sở dữ liệu phụ tùng tiêu chuẩn dựa trên dữ liệu bảo dưỡng được cấu trúc hóa tự động đi kèm với những thách thức kỹ thuật khác. Fitdata đang áp dụng các cách tiếp cận sau trong quá trình này.
- Thiết kế mô hình dữ liệu tích hợp: Thiết kế một lược đồ dữ liệu linh hoạt và có thể mở rộng để bao quát tên phụ tùng, số hiệu riêng, thông tin quy cách của các nhà sản xuất khác nhau. Hình thành một cấu trúc dữ liệu đa chiều dựa trên kiểu xe, năm sản xuất, danh mục phụ tùng (động cơ, thân xe, điện, v.v.) để có thể tìm thấy thông tin phụ tùng mong muốn một cách nhanh chóng và chính xác cho bất kỳ truy vấn (query) nào.
- Tinh chỉnh và xác minh dữ liệu: Áp dụng quy trình xác minh nhiều bước để giảm thiểu các lỗi có thể xảy ra trong quá trình OCR và NLP và duy trì tính nhất quán của dữ liệu. Ví dụ, nếu một phụ tùng không tương ứng với một số khung cụ thể được nhập vào, hoặc thông tin giá cả bất thường được bao gồm, hệ thống sẽ tự động phát hiện và sửa chữa hoặc yêu cầu quản trị viên xem xét.
- Học hỏi và cập nhật liên tục: Khi các kiểu xe máy và phụ tùng mới liên tục được phát hành, cơ sở dữ liệu phải được cập nhật liên tục. Fitdata đang áp dụng phương pháp ‘Học trực tuyến’ (Online Learning), trong đó mô hình AI học hỏi mỗi khi dữ liệu bảng kê chi tiết sửa chữa mới được nhập vào để tự động thêm và phân loại thông tin hoặc thuật ngữ phụ tùng mới vào cơ sở dữ liệu.
Cơ sở dữ liệu phụ tùng tiêu chuẩn được xây dựng thông qua quá trình này không chỉ là một danh sách tập hợp thông tin phụ tùng, mà còn hoạt động như một cơ sở hạ tầng cốt lõi giải quyết các vấn đề khác nhau của ngành công nghiệp xe máy.

Vượt ra ngoài cơ sở dữ liệu: Bảo dưỡng dự đoán và những khả năng mới
Cơ sở dữ liệu phụ tùng được tiêu chuẩn hóa và dữ liệu lịch sử bảo dưỡng tích lũy cho phép một công nghệ cốt lõi khác của Fitdata: Bảo dưỡng dự đoán (Predictive Maintenance). Fitdata sử dụng mô hình DeepSurv, một trong những kỹ thuật Phân tích sống còn (Survival Analysis), để dự đoán chu kỳ thay thế của một phụ tùng cụ thể. Điều này tiến một bước xa hơn so với phương pháp bảo dưỡng phòng ngừa (Preventive Maintenance) hiện có, vốn chỉ dựa trên quãng đường đi trung bình.
Mô hình DeepSurv tính toán động ‘điểm rủi ro hỏng hóc’ (risk score) của mỗi phụ tùng bằng cách xem xét toàn diện các biến số khác nhau như thói quen lái xe, môi trường lái xe và lịch sử bảo dưỡng trong quá khứ của từng chiếc xe máy. Thông qua đó, người lái xe sẽ nhận được thông báo thay thế phụ tùng kịp thời để phòng ngừa hỏng hóc, và các cửa hàng sửa chữa có thể nắm bắt trước nhu cầu bảo dưỡng tiềm năng để tối ưu hóa lượng phụ tùng tồn kho. Fitdata cho biết sai số tuyệt đối trung bình (MAE) của mô hình dự đoán này là khoảng 480 km, đây là mức độ đủ chính xác để người lái xe lên kế hoạch đến cửa hàng sửa chữa.
Hơn nữa, Fitdata đang mở rộng công nghệ của mình sang dịch vụ đề xuất mua xe máy cũ dựa trên LLM (Mô hình ngôn ngữ lớn) bằng cách sử dụng dữ liệu tích lũy. Đây là một dịch vụ sử dụng công nghệ Tạo sinh tăng cường truy xuất (RAG, Retrieval-Augmented Generation) để so sánh và phân tích các yêu cầu của người mua tiềm năng như ngân sách, mục đích lái xe, kiểu xe ưa thích với dữ liệu lịch sử bảo dưỡng thực tế và dữ liệu phụ tùng được tích lũy trong cơ sở dữ liệu để đề xuất những chiếc xe cũ tối ưu nhất. Thông qua đó, họ đặt mục tiêu giải quyết vấn đề bất đối xứng thông tin trên thị trường xe máy cũ và tạo ra một môi trường giao dịch đáng tin cậy cho người tiêu dùng. Fitdata đặt mục tiêu nâng độ chính xác của hệ thống đề xuất này lên 90%.

Tầm ảnh hưởng thị trường và triển vọng tương lai
Công nghệ của Fitdata không chỉ đơn thuần là nâng cao hiệu quả bảo dưỡng, mà còn có tiềm năng tác động tích cực đến toàn bộ hệ sinh thái của ngành công nghiệp xe máy. Họ đã chứng minh được tiềm năng đó thông qua nền tảng ‘REFAIRS’, hiện đang được hơn 100 cửa hàng sửa chữa và hơn 1.500 người lái xe sử dụng, và dựa trên đó, họ đang mở rộng sang các mô hình kinh doanh đa dạng như SaaS (Phần mềm dưới dạng dịch vụ) cho các cửa hàng sửa chữa, quản lý chuỗi cung ứng phụ tùng, và các dịch vụ B2B cho các công ty bảo hiểm và giao hàng.
Đặc biệt, thị trường mà Fitdata đang nhắm đến là các thị trường Đông Nam Á như Indonesia, Việt Nam, Thái Lan và Ấn Độ, nơi xe máy là phương tiện giao thông chính. Trong thị trường bảo dưỡng xe máy toàn cầu, dự kiến sẽ tăng trưởng từ 72,93 tỷ đô la vào năm 2025 lên 110 tỷ đô la vào năm 2035, giải pháp dựa trên dữ liệu của Fitdata được kỳ vọng sẽ có lợi thế cạnh tranh mạnh mẽ. Bằng cách chiếm lĩnh trước cơ sở hạ tầng dữ liệu được tiêu chuẩn hóa, Fitdata có thể sẽ đóng vai trò như một ‘hệ điều hành (OS)’ của ngành công nghiệp xe máy trong tương lai.
Kết luận: Vẽ nên tương lai mới cho ngành công nghiệp xe máy bằng dữ liệu
Fitdata đang sử dụng công nghệ AI để giải quyết vấn đề phân mảnh dữ liệu cố hữu của ngành công nghiệp xe máy và xây dựng một cơ sở hạ tầng cốt lõi là cơ sở dữ liệu phụ tùng được tiêu chuẩn hóa. Đây không chỉ là một thành tựu kỹ thuật, mà còn là chất xúc tác cho sự đổi mới, dẫn đến việc nâng cao hiệu quả của thị trường bảo dưỡng, đảm bảo tính minh bạch của giao dịch xe cũ và sự ra đời của các dịch vụ mới dựa trên dữ liệu như bảo dưỡng dự đoán.
Tất nhiên, việc thay đổi một ngành công nghiệp khổng lồ có vô số các bên liên quan không phải là một nhiệm vụ dễ dàng. Tuy nhiên, sự nhận thức vấn đề rõ ràng, chiều sâu kỹ thuật và khả năng thực thi táo bạo mà Fitdata thể hiện cho thấy họ có đủ năng lực để dẫn dắt quá trình chuyển đổi số của ngành công nghiệp xe máy. Thật đáng để theo dõi xem Fitdata sẽ vẽ nên tương lai mới của ngành công nghiệp xe máy như thế nào với la bàn là dữ liệu.