BỘ TÀI CHÍNH | CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM |
Số: 100/QĐ-BTC | Hà Nội, ngày 20 tháng 01 năm 2026 |
QUYẾT ĐỊNH
Ban hành mô hình kiến trúc cơ sở dữ liệu doanh nghiệp
____________________________________
BỘ TRƯỞNG BỘ TÀI CHÍNH
Căn cứ Luật Công nghệ thông tin ngày 29 tháng 6 năm 2006;
Căn cứ Luật An toàn thông tin mạng ngày 19 tháng 11 năm 2015;
Căn cứ Luật An ninh mạng ngày 12 tháng 6 năm 2018;
Căn cứ Luật Giao dịch điện tử ngày 22 tháng 6 năm 2023;
Căn cứ Luật Dữ liệu ngày 30 tháng 11 năm 2024;
Căn cứ Luật Bảo vệ dữ liệu cá nhân ngày 26 tháng 6 năm 2025;
Căn cứ Nghị quyết số 57-NQ/TW ngày 22 tháng 12 năm 2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia;
Căn cứ Nghị quyết số 68-NQ/TW ngày 04 tháng 5 năm 2025 của Bộ Chính trị về phát triển kinh tế tư nhân;
Căn cứ Kế hoạch số 02-KH/BCĐTW ngày 19 tháng 6 năm 2025 của Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số về thúc đẩy chuyển đổi số liên thông, đồng bộ, nhanh, hiệu quả đáp ứng yêu cầu sắp xếp tổ chức bộ máy của hệ thống chính trị;
Căn cứ Nghị quyết số 71/NQ-CP ngày 01 tháng 4 năm 2025 của Chính phủ sửa đổi hổ sung cập nhật Chương trình hành động của Chính phủ thực hiện Nghị quyết số 57-NQ/TW ngày 22 tháng 12 năm 2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia;
Căn cứ Nghị định số 64/2007/NĐ-CP ngày 10 tháng 4 năm 2007 của Chính phủ về việc ứng dụng công nghệ thông tin trong hoạt động của các cơ quan nhà nước;
Căn cứ Nghị định số 47/2020/NĐ-CP ngày 09 tháng 4 năm 2020 của Chính phủ về quản lý, kết nối và chia sẻ dữ liệu số của cơ quan nhà nước;
Căn cứ Nghị định số 42/2022/NĐ-CP ngày 24 tháng 06 năm 2022 của Chính phủ quy định về việc cung cấp thông tin và dịch vụ công trực tuyến của cơ quan nhà nước trên môi trường mạng;
Căn cứ Nghị định số 53/2022/NĐ-CP ngày 15 tháng 8 năm 2022 của Chính phủ quy định chi tiết một số điều của Luật An ninh mạng;
Căn cứ Nghị định số 137/2024/NĐ-CP ngày 23 tháng 10 năm 2024 của Chính phủ quy định về giao dịch điện tử của cơ quan nhà nước và hệ thống thông tin phục vụ giao dịch điện tử;
Căn cứ Nghị định số 29/2025/NĐ-CP ngày 24 tháng 02 năm 2025 của Chính phủ quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Bộ Tài chính;
Căn cứ Nghị định số 166/2025/NĐ-CP ngày 30/6/2025 của Chính phủ sửa đổi, bổ sung một số điều của Nghị định số 29/2025/NĐ-CP ngày 24 tháng 02 năm 2025 của Chính phủ quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Bộ Tài chính;
Căn cứ Quyết định số 2074/QĐ-TTg ngày 17 tháng 09 năm 2025 của Thủ tướng Chính phủ về việc Phê duyệt Đề án xây dựng Cơ sở dữ liệu doanh nghiệp;
Căn cứ Quyết định số 3685/QĐ-BTC ngày 31 tháng 10 năm 2025 của Bộ trưởng Bộ Tài chính về việc Ban hành Kế hoạch hành động của Bộ Tài chính triển khai thực hiện Quyết định số 2074/QĐ-TTg của Thủ tướng Chính phủ về việc xây dựng Cơ sở dữ liệu doanh nghiệp.
Căn cứ các Quyết định của Bộ trưởng Bộ Tài chính về chức năng, nhiệm vụ, tổ chức của các đơn vị thuộc, trực thuộc Bộ Tài chính;
Theo đề nghị của Cục trưởng Cục Phát triển doanh nghiệp tư nhân và kinh tế tập thể,
QUYẾT ĐỊNH:
Điều 1. Ban hành kèm theo Quyết định này mô hình Kiến trúc Cơ sở dữ liệu doanh nghiệp.
Điều 2. Tổ chức thực hiện
1. Cục Phát triển doanh nghiệp tư nhân và kinh tế tập thể.
a) Chủ trì, phối hợp với các đơn vị duy trì và tổ chức triển khai Kiến trúc Cơ sở dữ liệu doanh nghiệp được phê duyệt tại Quyết định này; cập nhật, điều chỉnh Kiến trúc Cơ sở dữ liệu doanh nghiệp phù hợp với điều kiện thực tế trong từng thời kỳ;
b) Chủ trì, phối hợp với các đơn vị liên quan tổ chức xây dựng Cơ sở dữ liệu doanh nghiệp theo Kiến trúc Cơ sở dữ liệu doanh nghiệp được phê duyệt tại Quyết định này;
c) Chịu trách nhiệm xây dựng Khung quản trị, quản lý dữ liệu chi tiết đối với Cơ sở dữ liệu doanh nghiệp. Chủ trì xây dựng, trình cấp có thẩm quyền ban hành hoặc ban hành theo thẩm quyền các quy trình và các văn bản quy định, hướng dẫn, các tiêu chuẩn kỹ thuật liên quan đến việc liên thông, chia sẻ dữ liệu của các hệ thống thông tin với các đơn vị có liên quan đến Cơ sở dữ liệu doanh nghiệp;
d) Tổ chức các khóa đào tạo cơ bản và nâng cao cho từng vị trí cán bộ thực hiện chức năng về quản trị dữ liệu chuyên trách tại đơn vị và các cán bộ có liên quan của các đơn vị sử dụng dữ liệu và đơn vị cung cấp dữ liệu nguồn trong phạm vi quản lý của Bộ Tài chính;
đ) Chủ trì, phối hợp với các đơn vị xây dựng kế hoạch và chi tiết hóa lộ trình phát triển các mảng dữ liệu của Cơ sở dữ liệu doanh nghiệp; Kế hoạch phối hợp với các đơn vị cung cấp dữ liệu, sử dụng dữ liệu trong việc kết xuất, tích hợp, bổ sung, chỉnh sửa Cơ sở dữ liệu doanh nghiệp, cũng như hướng dẫn, điều phối các hoạt động truy cập và sử dụng dữ liệu;
e) Thực hiện lựa chọn, quản lý, cập nhật và phát triển mô hình dữ liệu của Cơ sở dữ liệu doanh nghiệp, đảm bảo tính nhất quán của kiến trúc Cơ sở dữ liệu doanh nghiệp;
g) Chịu trách nhiệm về chất lượng, tính nhất quán của dữ liệu ở các mức khái niệm nghiệp vụ, mô hình logic và đặc tả dữ liệu (meta data), chủ trì phối hợp với các đơn vị liên quan trong việc cải thiện chất lượng dữ liệu;
h) Hướng dẫn, kiểm tra các đơn vị trong việc xây dựng, triển khai Cơ sở dữ liệu doanh nghiệp theo Kiến trúc cơ sở dữ liệu doanh nghiệp được ban hành tại Quyết định này;
i) Tổng hợp, trình cấp có thẩm quyền bố trí vốn đầu tư công, kinh phí chi thường xuyên trong dự toán ngân sách nhà nước hoặc nguồn thu hợp pháp khác để triển khai các dự án, nhiệm vụ ứng dụng công nghệ thông tin phù hợp với kiến trúc, lộ trình phát triển Cơ sở dữ liệu doanh nghiệp và quy định của pháp luật có liên quan.
2. Các đơn vị quản lý hệ thống thông tin, cơ sở dữ liệu (Cục Công nghệ thông tin và Chuyển đổi số, Cục Thuế, Cục Hải quan, Cục Thống kê, Bảo hiểm xã hội Việt Nam; Cục Đầu tư nước ngoài):
a) Tuân thủ chặt chẽ Kiến trúc Cơ sở dữ liệu doanh nghiệp được phê duyệt tại Quyết định này; Khung quản trị, quản lý dữ liệu chi tiết đối với Cơ sở dữ liệu doanh nghiệp và các quy định của Bộ về kết nối, chia sẻ dữ liệu;
b) Thực hiện việc tích hợp, cung cấp dữ liệu nguồn một cách đầy đủ, chính xác, kịp thời theo quy định;
c) Chủ động, phối hợp với Cục Phát triển doanh nghiệp tư nhân và kinh tế tập thể xây dựng, triển khai, phát triển, nâng cấp các ứng dụng, hệ thống thông tin, cơ sở dữ liệu chuyên ngành thuộc phạm vi quản lý của đơn vị; liên thông, tích hợp, đồng bộ, chia sẻ dữ liệu nguồn với Cơ sở dữ liệu doanh nghiệp.
Điều 3. Quyết định này có hiệu lực thi hành kể từ ngày ký. Cục trưởng Cục Phát triển doanh nghiệp tư nhân và kinh tế tập thể, Thủ trưởng các đơn vị thuộc và trực thuộc Bộ Tài chính chịu trách nhiệm thi hành Quyết định này./.
| KT. BỘ TRƯỞNG |
MÔ HÌNH KIẾN TRÚC CƠ SỞ DỮ LIỆU DOANH NGHIỆP
(Kèm theo Quyết định số 100/QĐ-BTC ngày 20 tháng 01 năm 2026 của Bộ Tài chính)
____________________________________
1. Mục tiêu
Kiến trúc Cơ sở dữ liệu (CSDL) doanh nghiệp được xây dựng nhằm đạt được các mục tiêu chiến lược theo lộ trình đã được Thủ tướng Chính phủ phê duyệt tại Quyết định 2074/QĐ-TTg, bao gồm:
- Mục tiêu tổng quát: Hình thành CSDL doanh nghiệp tập trung, thống nhất trên nền tảng là Cơ sở dữ liệu quốc gia (CSDLQG) về đăng ký doanh nghiệp (ĐKDN) cùng 05 nguồn dữ liệu khác (thuế, xuất nhập khẩu, bảo hiểm xã hội (BHXH), tín dụng, lao động) nhằm nắm bắt tình hình hoạt động của doanh nghiệp phục vụ quản lý nhà nước, nâng cao chất lượng hỗ trợ doanh nghiệp và minh bạch hóa thông tin.
- Mục tiêu cụ thể theo giai đoạn:
Giai đoạn 1 (Năm 2025): Xây dựng CSDL doanh nghiệp cơ bản tích hợp 04 nguồn dữ liệu (đăng ký doanh nghiệp, thuế, BHXH, xuất nhập khẩu). Ban hành và vận hành Bộ chỉ số đo lường sức khỏe doanh nghiệp (phiên bản cơ bản).
Giai đoạn 2 (Năm 2026): Nâng cấp CSDL, tích hợp dữ liệu tín dụng và đầu tư. Phát triển các công cụ phân tích nâng cao (AI, Machine Learning).
Giai đoạn 3 (2027 - 2030): Hoàn thiện hệ sinh thái dữ liệu, mở rộng tích hợp các lĩnh vực lao động, sở hữu trí tuệ, đổi mới sáng tạo. Phát triển dữ liệu mở và các dịch vụ dữ liệu gia tăng.
2. Mô hình kiến trúc tổng thể của CSDL doanh nghiệp.
Kiến trúc hệ thống CSDL doanh nghiệp được chia thành 8 lớp, bao gồm: Nền tảng hạ tầng công nghệ và quản trị vận hành; Nguồn dữ liệu; Tích hợp và xử lý dữ liệu đầu vào; Lưu trữ dữ liệu lõi; Phân tích dữ liệu và tính toán bộ chỉ số sức khỏe doanh nghiệp; Cổng truy cập và giao tiếp (API gateway); Ứng dụng và dịch vụ cung cấp; Đối tượng sử dụng và hưởng lợi. Xuyên suốt các lớp của hệ thống là lớp an toàn thông tin để đảm bảo tất cả các dữ liệu được bảo mật. Hệ thống CSDL doanh nghiệp không hình thành mới mà được phát triển dựa trên hệ thống CSDL quốc gia về đăng ký doanh nghiệp để tận dụng các lớp hạ tầng, lưu trữ, tích hợp có sẵn, kết hợp với nâng cấp, bổ sung các module nghiệp vụ phục vụ nhu cầu, chức năng mới của CSDL doanh nghiệp.
Hình 1: Kiến trúc Hệ thống CSDL doanh nghiệp

2.1. Lớp Nền tảng hạ tầng công nghệ và quản trị vận hành
Đây là lớp nền tảng về mặt vật lý và logic, đóng vai trò cung cấp tài nguyên và môi trường vận hành cho toàn bộ hệ thống. Lớp này bảo đảm hệ thống hoạt động ổn định, an toàn và thông suốt, đồng thời đáp ứng các yêu cầu về an ninh, an toàn thông tin. Bên cạnh hạ tầng công nghệ, lớp nền tảng còn bao gồm hệ thống chính sách, quy định, quy trình và yếu tố con người nhằm bảo đảm dữ liệu được quản lý một cách nhất quán, có chất lượng, an toàn, bảo mật và tuân thủ đầy đủ các quy định pháp luật hiện hành. Thành phần:
- Lưu trữ và tính toán hiệu năng cao (High-Performance Computing & Storage - HPC): bao gồm các hệ thống máy chủ và thiết bị lưu trữ chuyên dụng, có năng lực xử lý các tác vụ tính toán phức tạp và lưu trữ khối lượng dữ liệu lớn. Thành phần này có vai trò đáp ứng yêu cầu xử lý các thuật toán phân tích chuyên sâu, các mô hình trí tuệ nhân tạo và học máy (AI/ML), đồng thời bảo đảm lưu trữ an toàn cho Hồ dữ liệu (Data Lake) và Kho dữ liệu doanh nghiệp (Enterprise Data Warehouse - EDW).
- Mạng truyền thông an toàn: Hạ tầng mạng máy tính tốc độ cao, được phân đoạn, bảo mật và có độ tin cậy cao, bao gồm cả kết nối nội bộ giữa các thành phần hệ thống và kết nối ra bên ngoài (Internet, mạng truyền số liệu chuyên dùng CPNET của Chính phủ).
- Quản trị và an ninh toàn diện là tập hợp các chính sách, quy định, quy trình, công nghệ và yếu tố con người nhằm bảo đảm dữ liệu được quản lý nhất quán, có chất lượng, an toàn, bảo mật và tuân thủ các quy định của pháp luật, bao gồm:
(1) Khung Quản trị dữ liệu (Data Governance Framework): bộ quy tắc, vai trò, trách nhiệm và quy trình được thiết lập để quản lý tài sản dữ liệu của tổ chức. Khung Quản trị dữ liệu (Data Governance Framework) có vai trò bảo đảm chất lượng dữ liệu, tính nhất quán, khả năng sử dụng, an toàn và tuân thủ; đồng thời xác định rõ chủ thể, phạm vi và mức độ quyền hạn đối với từng loại dữ liệu.
(2) Quản lý định danh và truy cập (Identity and Access Management - IAM): hệ thống quản lý thông tin định danh của người dùng và các hệ thống, đồng thời kiểm soát quyền truy cập của các đối tượng này vào các tài nguyên nhằm bảo đảm chỉ những người dùng và hệ thống hợp lệ mới được phép truy cập vào hệ thống và chỉ được thực hiện các hành động trong phạm vi quyền hạn được cấp.
(3) Giải pháp an ninh mạng, mã hóa dữ liệu, phòng chống tấn công: các công nghệ và biện pháp kỹ thuật như tường lửa, hệ thống phát hiện và ngăn chặn xâm nhập (IDS/IPS), mã hóa dữ liệu trong quá trình lưu trữ và truyền tải, các giải pháp phòng, chống mã độc và DDoS,... Các giải pháp này có vai trò bảo vệ hệ thống và dữ liệu trước các mối đe dọa từ bên trong và bên ngoài.
(4) Kiểm soát, giám sát hoạt động hệ thống: tập hợp các cơ chế ghi nhật ký (log) toàn bộ hoạt động truy cập, thay đổi dữ liệu và các sự kiện quan trọng trong hệ thống, kết hợp với các công cụ giám sát hiệu năng và phát hiện bất thường nhằm phục vụ công tác theo dõi tuân thủ, điều tra, xử lý sự cố, phát hiện kịp thời các hành vi bất thường và bảo đảm hệ thống hoạt động an toàn, ổn định.
2.2. Lớp Nguồn dữ liệu
Trên cơ sở lấy CSDLQG về ĐKDN làm nền tảng, tích hợp, chia sẻ có chọn lọc các dữ liệu từ các hệ thống thông tin và nguồn khác nhau, bao gồm:
- CSDLQG về ĐKDN (nền tảng, Cục Phát triển doanh nghiệp tư nhân và kinh tế tập thể).
- CSDL chuyên ngành quản lý Thuế (Cục Thuế).
- CSDL thống kê quốc gia (Cục Thống kê).
- CSDLQG về bảo hiểm (BHXH Việt Nam).
- CSDLQG về đầu tư nước ngoài và đầu tư ra nước ngoài (Cục Đầu tư nước ngoài).
- CSDL các bộ, ngành khác (Bộ Khoa học và Công nghệ, Bộ Công Thương, Ngân hàng nhà nước Việt Nam, Bộ Nội vụ,...).
- Dữ liệu mở và các nguồn công khai khác.
Phân loại dữ liệu:
- Dữ liệu chủ: Dữ liệu về đăng ký doanh nghiệp (ĐKDN)
- Dữ liệu danh mục: Dữ liệu về phường, xã, tình trạng pháp lý,...
- Dữ liệu tổng hợp: Dữ liệu tổng hợp từ CSDL tổng hợp về tài chính, CSDL thuế, CSDL Hải quan, CSDL BHXH,...
- Dữ liệu mở: Dữ liệu số lượng doanh nghiệp đang hoạt động, tạm ngừng, giải thể,... theo danh mục dữ liệu mở của Bộ Tài chính.
2.3. Lớp Tích hợp và xử lý dữ liệu đầu vào
Lớp này chịu trách nhiệm thu thập, làm sạch, chuẩn hóa và chuyển đổi dữ liệu từ các nguồn khác nhau, nhằm chuẩn bị dữ liệu cho công tác lưu trữ, khai thác và phân tích trong toàn bộ hệ thống, bao gồm:
- Cổng Tích hợp dữ liệu (Data Integration Gateway - sử dụng ETL/ELT): các công cụ và quy trình tự động phục vụ việc trích xuất (Extract) dữ liệu từ các hệ thống nguồn, thực hiện chuyển đổi (Transform) dữ liệu theo các quy tắc đã được xác định trước, như thay đổi định dạng, làm giàu dữ liệu, và tải (Load) dữ liệu vào các hệ thống lưu trữ đích, bao gồm Hồ dữ liệu và Kho dữ liệu doanh nghiệp. Trong đó, mô hình ELT (Extract, Load, Transform) cho phép dữ liệu thô được tải trực tiếp vào Hồ dữ liệu, sau đó mới thực hiện chuyển đổi khi có nhu cầu khai thác. Cổng Tích hợp dữ liệu có vai trò tự động hóa quá trình thu thập và tiền xử lý dữ liệu từ nhiều nguồn khác nhau, bảo đảm dữ liệu được tích hợp vào hệ thống một cách nhất quán, kịp thời và hiệu quả.
- Làm sạch, chuẩn hóa dữ liệu được thực hiện thông qua các quy trình, thuật toán và công cụ nhằm phát hiện và xử lý các lỗi dữ liệu như sai chính tả, giá trị không hợp lệ, dữ liệu thiếu; loại bỏ dữ liệu trùng lặp; đồng thời đưa dữ liệu về thống nhất về định dạng, cấu trúc và bộ mã dùng chung. Việc chuẩn hóa được thực hiện theo các chuẩn quy định, ví dụ như mã địa giới hành chính, mã ngành kinh tế Việt Nam (VSIC), chuẩn hóa tên, địa chỉ và các danh mục dùng chung khác.
- Quản trị chất lượng dữ liệu đầu vào (Data Quality Management for Ingestion): tập hợp các cơ chế, quy tắc và công cụ nhằm theo dõi, đo lường, đánh giá và báo cáo chất lượng dữ liệu ngay từ giai đoạn thu thập và tích hợp; có vai trò bảo đảm dữ liệu được đưa vào hệ thống đáp ứng các tiêu chuẩn chất lượng đã được xác định, bao gồm tính đầy đủ, tính chính xác, tính kịp thời và tính nhất quán. Việc thiết kế và triển khai quản trị chất lượng dữ liệu ngay từ đầu giúp ngăn ngừa sự lan truyền của các vấn đề về chất lượng dữ liệu trong toàn hệ thống, giảm chi phí khắc phục ở các giai đoạn sau và nâng cao độ tin cậy của các sản phẩm, dịch vụ dữ liệu đầu ra.
2.4. Lớp Lưu trữ và quản lý dữ liệu lõi
Nơi tập trung, lưu trữ và quản lý toàn bộ dữ liệu doanh nghiệp đã được tích hợp và xử lý, tạo thành CSDL doanh nghiệp, bao gồm:
- CSDL doanh nghiệp (Nền tảng: CSDLQG về DKDN): thực thể logic bao gồm toàn bộ dữ liệu doanh nghiệp được quản lý trong hệ thống. CSDL này được xây dựng trên cơ sở nâng cấp, mở rộng CSDLQG về ĐKDN hiện có, đồng thời tích hợp, liên thông và làm giàu dữ liệu từ các nguồn dữ liệu khác. Việc thiết kế CSDL này nhằm khắc phục tình trạng dữ liệu phân tán, hình thành “nguồn sự thật duy nhất” (single source of truth) để phục vụ thống nhất cho mọi nhu cầu quản lý, khai thác và sử dụng dữ liệu.
- Kho dữ liệu doanh nghiệp: hệ thống cơ sở dữ liệu được thiết kế chuyên biệt cho mục đích báo cáo, truy vấn và phân tích nghiệp vụ (Business Intelligence). Dữ liệu trong Kho dữ liệu doanh nghiệp được tổ chức theo các chủ đề, được tích hợp từ nhiều nguồn, có tính lịch sử (time-variant), ổn định (non-volatile), đã được làm sạch và cấu trúc hóa. Kho dữ liệu doanh nghiệp có vai trò cung cấp nền tảng dữ liệu tối ưu cho việc xây dựng các báo cáo quản trị, phân tích đa chiều và là nguồn dữ liệu chính phục vụ tính toán Bộ chỉ số đo lường sức khỏe doanh nghiệp (Business Health Index - BHI), đồng thời hỗ trợ các truy vấn phức tạp với yêu cầu hiệu năng cao.
- Hồ dữ liệu: kho lưu trữ dữ liệu tập trung cho phép lưu trữ khối lượng lớn dữ liệu ở nhiều định dạng khác nhau, bao gồm dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc, ngay tại thời điểm dữ liệu được thu thập từ các nguồn dưới dạng dữ liệu thô. Hồ dữ liệu cung cấp môi trường lưu trữ linh hoạt cho tất cả các loại dữ liệu, phục vụ các hoạt động khám phá dữ liệu, phân tích dữ liệu lớn, huấn luyện các mô hình Trí tuệ nhân tạo (AI) và Học máy (ML) mà không yêu cầu phải xác định trước lược đồ dữ liệu. Việc thiết kế Hồ dữ liệu nhằm tạo điều kiện cho các nhà khoa học dữ liệu và chuyên gia phân tích làm việc trực tiếp với dữ liệu gốc, khai thác các thông tin chuyên sâu mới, đồng thời lưu trữ dữ liệu lịch sử chi tiết và dữ liệu chưa qua xử lý.
- Quản lý Dữ liệu Chủ (Master Data Management - MDM): tập hợp các quy trình, chính sách, tiêu chuẩn và công cụ công nghệ nhằm tạo lập và duy trì một “phiên bản dữ liệu chuẩn” (golden record) chính xác, nhất quán và đáng tin cậy đối với các thực thể dữ liệu cốt lõi của hệ thống, như thông tin định danh doanh nghiệp, mã số thuế, địa chỉ chuẩn hóa, danh mục ngành nghề. Quản lý dữ liệu Chủ bảo đảm tồn tại một nguồn dữ liệu chủ duy nhất và chính xác cho các đối tượng dữ liệu quan trọng, qua đó loại bỏ sự trùng lặp, mâu thuẫn và không nhất quán giữa các hệ thống và nguồn dữ liệu khác nhau, đồng thời liên kết các bản ghi từ nhiều nguồn về cùng một thực thể doanh nghiệp. Việc triển khai Kho dữ liệu doanh nghiệp là nền tảng bảo đảm tính toàn vẹn, nhất quán và chất lượng cao của dữ liệu trong toàn bộ hệ thống, góp phần hình thành cái nhìn đầy đủ, chính xác, toàn diện (360 độ) về doanh nghiệp, phục vụ hiệu quả cho công tác phân tích, báo cáo và ra quyết định.
2.5. Lớp Phân tích và tính toán bộ chỉ số đo lường sức khỏe doanh nghiệp
Lớp Phân tích và tính toán Bộ chỉ số đo lường sức khỏe doanh nghiệp là lớp chức năng thực hiện các hoạt động phân tích chuyên sâu, khai phá tri thức từ dữ liệu và xây dựng các sản phẩm thông tin có giá trị gia tăng cao, phục vụ công tác quản lý nhà nước, hỗ trợ ra quyết định và cung cấp thông tin cho doanh nghiệp. Thành phần gồm có:
- Phân tích dữ liệu lớn (Big Data Analytics), trí tuệ nhân tạo (AI) / học máy (ML) là thành phần bao gồm các công cụ, nền tảng, thư viện và thuật toán tiên tiến nhằm xử lý và phân tích các tập dữ liệu lớn, đa dạng và phức tạp. Thành phần này cho phép phát hiện các mẫu tiềm ẩn trong dữ liệu, xây dựng các mô hình dự báo, mô hình phân loại và hỗ trợ tự động hóa một số quyết định dựa trên dữ liệu. Thông qua Phân tích dữ liệu lớn (Big Data Analytics), AI và ML, hệ thống có khả năng khai thác sâu giá trị của dữ liệu, tạo ra các thông tin phân tích chuyên sâu (insight), dự báo xu hướng phát triển của doanh nghiệp, phát hiện sớm các dấu hiệu rủi ro hoặc hành vi gian lận, thực hiện phân cụm doanh nghiệp và hỗ trợ cá nhân hóa các dịch vụ. Việc thiết kế thành phần này nhằm tận dụng hiệu quả sức mạnh của các công nghệ phân tích tiên tiến, khắc phục các hạn chế của phương pháp phân tích truyền thống, qua đó nâng cao chất lượng phân tích, năng lực dự báo và hiệu quả phục vụ công tác quản lý nhà nước cũng như hoạt động hỗ trợ doanh nghiệp.
- Công cụ trực quan hóa và khám phá dữ liệu (dành cho chuyên gia): Các phần mềm và công cụ hỗ trợ các nhà phân tích dữ liệu và nhà khoa học dữ liệu biểu diễn thông tin dưới dạng biểu đồ, đồ thị, bản đồ tương tác và các hình thức trực quan khác. Các công cụ này giúp chuyên gia dễ dàng nhận diện các mẫu hình, xu hướng và các điểm bất thường trong dữ liệu; thực hiện phân tích khám phá (exploratory data analysis), kiểm định giả thuyết và trao đổi, chia sẻ kết quả phân tích trong nội bộ đội ngũ kỹ thuật hoặc với các bên liên quan có chuyên môn. Việc thiết kế và triển khai các công cụ trực quan hóa và khám phá dữ liệu nhằm đáp ứng nhu cầu làm việc chuyên sâu của đội ngũ phân tích, đồng thời nâng cao khả năng hiểu, diễn giải và khai thác dữ liệu một cách hiệu quả.
2.6. Lớp Cổng truy cập và giao
Lớp cổng truy cập và giao tiếp (API Gateway) đóng vai trò là cửa ngõ trung gian, thực hiện chức năng quản lý, điều phối và bảo đảm an toàn, an ninh cho việc truy cập vào dữ liệu và các dịch vụ phân tích của hệ thống từ các ứng dụng, hệ thống bên ngoài. Trong đó:
- Quản lý, bảo mật, điều phối API: Phần mềm thực hiện quản lý tập trung toàn bộ vòng đời của các giao diện lập trình ứng dụng (API) do CSDL doanh nghiệp cung cấp. Thành phần này thực hiện các chức năng xác thực yêu cầu truy cập (authentication), ủy quyền truy cập (authorization), kiểm soát và điều tiết lưu lượng truy cập (rate limiting, throttling), giám sát hoạt động (monitoring), ghi nhật ký (logging), định tuyến yêu cầu đến các dịch vụ phía sau (backend) phù hợp; đồng thời hỗ trợ chuyển đổi giao thức và/hoặc định dạng dữ liệu khi cần thiết. Thông qua đó, Lớp cổng truy cập và giao tiếp bảo đảm việc cung cấp và khai thác API được thực hiện an toàn, ổn định, hiệu quả và có kiểm soát.
- Cung cấp API Dữ liệu và Phân tích: Công bố và vận hành các giao diện lập trình ứng dụng cho phép các ứng dụng hoặc hệ thống khác của cơ quan nhà nước, doanh nghiệp hoặc bên thứ ba được cấp phép truy vấn và truy xuất dữ liệu đã được xử lý từ Lớp Lưu trữ, cũng như các kết quả phân tích từ Lớp Phân tích, bao gồm Bộ chỉ số đo lường sức khỏe doanh nghiệp. Thành phần này có vai trò tạo lập khả năng kết nối, liên thông, chia sẻ và khai thác dữ liệu một cách tự động, theo chương trình, bảo đảm tuân thủ các quy định về quản lý, bảo mật và sử dụng dữ liệu giữa CSDL doanh nghiệp và các hệ thống thông tin khác.
2.7. Lớp Ứng dụng và dịch vụ cung cấp
Lớp Ứng dụng và dịch vụ cung cấp cung cấp các giao diện người dùng và dịch vụ ứng dụng, nơi người dùng cuối và các hệ thống liên quan trực tiếp tương tác để khai thác, sử dụng và phát huy giá trị của CSDL doanh nghiệp, bao gồm:
- Cổng thông tin quốc gia về ĐKDN, Mobile Apps: Cung cấp một điểm truy cập tập trung, thống nhất và thân thiện cho các nhóm đối tượng sử dụng, bao gồm cơ quan nhà nước, doanh nghiệp và người dân, để thực hiện tra cứu thông tin doanh nghiệp, khai thác các dịch vụ công trực tuyến (trong trường hợp được tích hợp), theo dõi và khai thác các báo cáo thông tin; đồng thời có tiềm năng cho phép doanh nghiệp cập nhật một số thông tin liên quan đến chính doanh nghiệp mình theo quy trình, thẩm quyền và quy định hiện hành.
- Dịch vụ Báo cáo và Dashboard cho người dùng cuối (dành cho cơ quan nhà nước): bao gồm các báo cáo được tạo sẵn (standard reports) và các bảng thông tin tổng hợp, trực quan (dashboards) được thiết kế phù hợp với nhu cầu sử dụng của từng nhóm đối tượng cụ thể, như lãnh đạo các cơ quan quản lý nhà nước và cán bộ chuyên môn. Các dịch vụ này cung cấp thông tin đã được tổng hợp, phân tích và trình bày dưới dạng trực quan, dễ tiếp cận, giúp người sử dụng nhanh chóng nắm bắt tình hình, theo dõi các chỉ tiêu, chỉ số trọng yếu và hỗ trợ hiệu quả cho công tác chỉ đạo, điều hành và ra quyết định.
- Dịch vụ tra cứu, Dữ liệu mở cho doanh nghiệp/xã hội: Cung cấp các chức năng cho phép doanh nghiệp và công chúng tra cứu các thông tin cơ bản, được phép công khai liên quan đến doanh nghiệp theo quy định của pháp luật. Đồng thời, cung cấp các tập dữ liệu mở có chọn lọc, với phạm vi và mức độ phù hợp, để các tổ chức, cá nhân có thể tải về và sử dụng cho mục đích nghiên cứu, phân tích, phát triển các ứng dụng, sản phẩm và dịch vụ mới. Việc cung cấp dịch vụ tra cứu và dữ liệu mở góp phần nâng cao tính minh bạch của môi trường kinh doanh, tăng cường khả năng giám sát của xã hội và thúc đẩy đổi mới sáng tạo dựa trên dữ liệu.
- Dịch vụ dựa trên BHI (Cảnh báo, Hỗ trợ): Các ứng dụng và chức năng được xây dựng trên cơ sở kết quả phân tích và điểm số của BHI. Các dịch vụ này có thể bao gồm hệ thống cảnh báo sớm cho cơ quan quản lý nhà nước đối với các doanh nghiệp có điểm BHI thấp hoặc có dấu hiệu rủi ro cao; các công cụ hỗ trợ đề xuất, gợi ý các chính sách, chương trình hỗ trợ phù hợp cho từng nhóm doanh nghiệp dựa trên đặc điểm BHI; cũng như các chức năng cho phép doanh nghiệp tự đánh giá, so sánh mức độ “sức khỏe” của mình với các doanh nghiệp khác trong cùng ngành hoặc cùng nhóm quy mô. Các dịch vụ dựa trên BHI góp phần nâng cao hiệu quả quản lý, hỗ trợ doanh nghiệp phát triển bền vững và là minh chứng cho giá trị gia tăng của việc khai thác CSDL doanh nghiệp.
2.8. Lớp Đối tượng sử dụng và hưởng lợi
Lớp Đối tượng sử dụng và hưởng lợi là lớp bao gồm các cá nhân, tổ chức trực tiếp tương tác với hệ thống và khai thác các giá trị, lợi ích do Hệ thống CSDL doanh nghiệp mang lại.
- Cơ quan quản lý nhà nước (chính phủ, các bộ, ngành, địa phương) là nhóm đối tượng sử dụng trọng tâm của hệ thống. Các cơ quan quản lý nhà nước sử dụng thông tin và các công cụ phân tích từ hệ thống để phục vụ công tác hoạch định và điều chỉnh chính sách, theo dõi, giám sát tình hình hoạt động của doanh nghiệp, đánh giá tác động chính sách, quản lý rủi ro, cũng như hỗ trợ công tác chỉ đạo, điều hành phát triển kinh tế - xã hội ở các cấp.
- Doanh nghiệp, hợp tác xã, hộ kinh doanh, nhà đầu tư, các tổ chức nghiên cứu và người dân khai thác hệ thống để tra cứu thông tin doanh nghiệp theo quy định, thực hiện tự đánh giá tình hình hoạt động và mức độ “sức khỏe” của doanh nghiệp, tiếp cận các dịch vụ hỗ trợ phù hợp; đồng thời, cộng đồng có thể tiếp cận nguồn thông tin minh bạch và sử dụng các tập dữ liệu mở phục vụ nghiên cứu, phân tích và phát triển các sáng kiến, ứng dụng mới.
- Các tổ chức liên quan như Liên đoàn Thương mại và Công nghiệp Việt Nam (VCCI), các hiệp hội doanh nghiệp, tổ chức tài chính và các tổ chức trung gian khác sử dụng thông tin từ hệ thống để hỗ trợ hoạt động của hội viên, thực hiện các nghiên cứu, phân tích thị trường, đánh giá tín dụng, quản trị rủi ro và xây dựng các sản phẩm, dịch vụ phục vụ cộng đồng doanh nghiệp.
3. Mô hình kết nối, chia sẻ dữ liệu.
Hình 2: Mô hình kết nối, chia sẻ dữ liệu

Hệ thống CSDL doanh nghiệp kết nối với các CSDL nguồn thông qua Nền tảng tích hợp thông tin của Hệ thống CSDLQG về ĐKDN để tận dụng nền tảng sẵn có bởi Nền tảng này đang kết nối, chia sẻ dữ liệu hiệu quả với CSDL Thuế, CSDL BHXH, các hệ thống thông tin của 13 bộ, ngành và các tỉnh/thành phố trực thuộc trung ương, cụ thể:
- CSDLQG về ĐKDN kết nối với các CSDL do Bộ Tài chính quản lý, vận hành (CSDL Tổng hợp tài chính, CSDL Thuế, CSDL BHXH,...) thông qua nền tảng tích hợp, chia sẻ dữ liệu của Bộ Tài chính (LGSP).
- Đối với CSDL khác của bộ ngành: kết nối thông qua Nền tảng tích hợp, chia sẻ dữ liệu quốc gia (NDXP).
- Đối với CSDL tổng hợp quốc gia: kết nối thông qua Nền tảng tích hợp, chia sẻ dữ liệu của Trung tâm dữ liệu quốc gia khi CSDL tổng hợp quốc gia tổng hợp các dữ liệu pháp lý của các CSDLQG, CSDL chuyên ngành khác.
- Nguồn dữ liệu từ xã hội, web...: kết nối trực tiếp với Nền tảng tích hợp thông tin của Hệ thống CSDLQG về ĐKDN thông qua cơ chế web scraping, AI Agent.