Ngày đăng: Aug 8, 2025
Nghiên cứu & Phát triển (R&D):
- Chủ động nghiên cứu, thử nghiệm (PoC) và đánh giá các công nghệ, tính năng mới của OpenStack, Ceph và các hệ sinh thái liên quan (Kubernetes, Service Mesh, v.v.).
- Đề xuất và phát triển các giải pháp mới để tối ưu hóa hiệu năng, tăng cường bảo mật và nâng cao độ tin cậy của toàn bộ hệ thống.
- Xây dựng các công cụ, kịch bản (scripts) tự động hóa để phục vụ cho việc triển khai, quản trị và giám sát.
Triển khai & Tích hợp:
- Tham gia thiết kế và triển khai các cụm (clusters) OpenStack và Ceph mới theo kiến trúc High Availability (HA).
- Tích hợp các giải pháp của bên thứ ba (hardware, software) vào hệ sinh thái Cloud hiện có.
- Phát triển và duy trì các playbook Ansible, mã Terraform để quản lý hạ tầng dưới dạng mã (Infrastructure as Code).
Vận hành & Tối ưu hóa:
- Giám sát, phân tích và đảm bảo hiệu năng, sự ổn định của hệ thống 24/7.
- Xử lý các sự cố phức tạp, phân tích nguyên nhân gốc rễ (Root Cause Analysis - RCA) và đưa ra các giải pháp khắc phục triệt để.
- Thực hiện tuning hiệu năng ở các lớp: Linux Kernel, mạng, Ceph OSD, và các dịch vụ OpenStack.
- Lập kế hoạch và thực thi việc nâng cấp, bảo trì hệ thống mà không gây ảnh hưởng (hoặc ảnh hưởng tối thiểu) đến dịch vụ..
1. Yêu cầu chung
MUST HAVE:
Kinh nghiệm:
- Tối thiểu 5 năm kinh nghiệm làm việc chuyên sâu với hệ thống Private Cloud quy mô lớn.
Tiếng Anh: Tối thiểu TOEIC 650 hoặc tương đương.
OpenStack: Có kinh nghiệm triển khai và vận hành các thành phần cốt lõi (Nova, Neutron, Cinder, Glance, Keystone) trong môi trường production. Hiểu rõ kiến trúc HA của OpenStack.
Ceph: Có kinh nghiệm triển khai và quản trị cụm Ceph, đặc biệt là Ceph RBD cho Cinder và Glance. Hiểu về CRUSH map và các cơ chế pooling.
Linux: Quản trị thành thạo Linux (Ubuntu/CentOS), có kiến thức sâu về Networking (Bonding, VLAN, OVS/Linux Bridge) và Kernel.
Tự động hóa: Sử dụng thành thạo Ansible để triển khai và quản lý cấu hình.
Scripting: Có khả năng viết kịch bản tự động hóa bằng Bash hoặc Python.
NICE TO HAVE:
Kinh nghiệm: Đã từng tham gia vào quá trình thiết kế kiến trúc hệ thống từ đầu.
Giám sát: Có kinh nghiệm xây dựng hệ thống giám sát với Prometheus, Grafana, và Alertmanager.
Containerization: Có kiến thức về Docker, Kubernetes và cách chúng tích hợp với OpenStack (ví dụ: Magnum, Kuryr).
Ceph Nâng cao: Có kinh nghiệm với Ceph RGW (S3), CephFS, hoặc đã từng thực hiện tuning hiệu năng Ceph cho các workload đặc thù.
Mạng nâng cao: Hiểu biết về SDN, BGP, EVPN/VXLAN.
CI/CD: Có kinh nghiệm xây dựng pipeline CI/CD cho Infrastructure as Code (ví dụ: sử dụng GitLab CI, Jenkins).
Ưu tiên: Dưới 36 tuổi
2. Yêu cầu về khả năng làm việc
MUST HAVE:
Tự chủ xử lý sự cố: Có khả năng độc lập chẩn đoán và xử lý các sự cố phức tạp liên quan đến OpenStack và Ceph.
Triển khai theo kịch bản: Có thể tự tin triển khai một cụm OpenStack/Ceph mới từ đầu dựa trên tài liệu thiết kế và playbook Ansible có sẵn.
Tối ưu hóa cơ bản: Có thể xác định và xử lý các điểm nghẽn hiệu năng phổ biến (CPU, RAM, I/O, Network).
Viết tài liệu: Có khả năng viết tài liệu kỹ thuật, hướng dẫn vận hành (runbook) và báo cáo phân tích sự cố (RCA report) một cách rõ ràng, mạch lạc.
NICE TO HAVE:
Thiết kế giải pháp: Có khả năng đề xuất và bảo vệ một giải pháp kỹ thuật mới để giải quyết một bài toán cụ thể.
Phát triển công cụ: Có thể tự phát triển các công cụ (tooling) nhỏ bằng Python/Bash để tự động hóa các tác vụ lặp đi lặp lại.
Tối ưu hóa chuyên sâu: Có thể thực hiện tuning các tham số ở tầng sâu (kernel, Ceph BlueStore, Cinder scheduler) để đạt hiệu năng tối ưu cho từng loại workload.
Lập kế hoạch nâng cấp: Có thể lập kế hoạch chi tiết và thực thi một quy trình nâng cấp phiên bản lớn cho OpenStack hoặc Ceph.
3. Động lực làm việc
MUST HAVE:
Chủ động học hỏi: Sẵn sàng và chủ động nghiên cứu các công nghệ mới khi được yêu cầu hoặc khi nhận thấy nó cần thiết cho hệ thống.
Chia sẻ kiến thức: Luôn sẵn lòng chia sẻ những gì mình học được cho các thành viên khác trong nhóm.
Tuân thủ quy trình: Hiểu và cam kết tuân thủ các quy trình làm việc chuẩn của đội ngũ (ví dụ: quy trình Change Management, Incident Response).
Cải tiến liên tục: Luôn đặt câu hỏi "Làm thế nào để làm việc này tốt hơn?" và không ngại đề xuất các cải tiến cho quy trình và công nghệ hiện tại.
NICE TO HAVE:
Đóng góp cho cộng đồng: Mong muốn tham gia và đóng góp cho các dự án mã nguồn mở (OpenStack, Ceph).
Lấy chứng chỉ: Có định hướng thi các chứng chỉ chuyên môn quốc tế như Certified OpenStack Administrator (COA), Red Hat Certified Specialist in Ceph Storage Administration.
Mentor: Sẵn sàng hướng dẫn, đào tạo các thành viên mới hoặc ít kinh nghiệm hơn.
4. Về văn hoá
MUST HAVE:
Tinh thần trách nhiệm cao: Coi sự ổn định của hệ thống là trách nhiệm của bản thân. Sẵn sàng tham gia xử lý sự cố ngoài giờ khi cần thiết.
Tư duy logic và hệ thống: Tiếp cận vấn đề một cách có phương pháp, chia nhỏ vấn đề phức tạp thành các phần đơn giản hơn để giải quyết.
Giao tiếp hiệu quả: Có khả năng giao tiếp, trình bày các vấn đề kỹ thuật một cách rõ ràng và hiệu quả với cả những người có và không có nền tảng kỹ thuật.
Tinh thần đồng đội: Luôn hợp tác, hỗ trợ đồng nghiệp và đặt mục tiêu chung của đội lên hàng đầu.
NICE TO HAVE:
Bình tĩnh dưới áp lực: Có khả năng giữ được sự bình tĩnh và đưa ra quyết định sáng suốt khi đối mặt với các sự cố nghiêm trọng (major incidents).
Khiêm tốn và cầu thị: Luôn lắng nghe các ý kiến trái chiều và sẵn sàng thừa nhận khi mình sai.
Đam mê công nghệ: Thực sự yêu thích việc tìm hiểu, làm chủ và "thuần hóa" những công nghệ phức tạp.
1. Chế độ lương, thưởng, thu nhập:
2. Môi trường làm việc: