Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

dữ liệu lớn trong kinh tế và kinh doanh, Slides of Market economy

dữ liệu lớn trong kinh tế và kinh doanh

Typology: Slides

2019/2020

Uploaded on 09/06/2021

lan-anh-tran-2
lan-anh-tran-2 🇻🇳

3.6

(5)

5 documents

1 / 8

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
NỘI DUNG ÔN TẬP MÔN DỮ LIỆU LỚN TRONG KINH TẾ VÀ KINH DOANH
Câu 1. Phân tích các nguồn hình thành dữ liệu lớn. Tại sao lại phải quản trị dữ liệu lớn?
Nguồn hình thành dữ liệu lớn
Qua thống kê và tổng hợp, nguồn dữ liệu lớn được hình thành chủ yếu từ 6 nguồn:
1. Dữ liệu hành chính (phát sinh từ chương trình của một tổ chức, có thể là chính
phủ hay phi chính phủ)
2. Dữ liệu từ hoat động thương mại (phát sinh từ giao dịch giữa 2 thực thể)
3. Dữ liệu từ các thiết bị cảm biến như thiết bị chụp hình ảnh vệ tinh, cảm biến
đường, cảm biến khí hậu
4. Dữ liệu từ các thiết bị theo dõi vd: theo dõi dl từ đt
5. Dữ liệu từ các hành vi vd: tìm kiếm trực tuyến, đọc các trang mạng trực tiếp
6. Dữ liệu từ các thông tin về ý kiến, quan điểm của các cá nhân, tổ chức, trên các
phương tiện thông tin xã hội
Phải quản trị nguồn dữ liệu lớn. vì tkhi quản trị dữ liệu tốt giúp các tổ chức, doanh
nghiệp đạt được lợi thế cạnh tranh tiềm năng so với các đối thủ kinh doanh của họ
bằng cách cải thiện hiệu quả hoạt động và cho phép ra quyết định tốt hơn. Các tổ
chức có dữ liệu được quản tốt thể trở nên linh hoạt hơn, nhanh chóng phát
hiện xu hướng thị trường để tận dụng các cơ hội kinh doanhPnhanh chóng.
-Quản trị DLPtốt cũng hỗ trợ doanh nghiệp rất nhiều trong công tác đánh
giá,Pnghiên cứu thị trường: đánh giá hài lòng khách hàng, đánh giá năng lực
nhân viên, nghiên cứu đối thủ cạnh tranh, ...P
Câu 2: Phân tích đặc trưng 5V của dữ liệu lớn. Nếu giả sử em là chủ sở hữu một nguồn dữ
liệu của 1 tỷ người sử dụng mạng xã hội thì em sẽ có giải pháp kinh doanh hợp pháp nào từ
kho dữ liệu lớn này.
* Đặc trưng 5V của dữ liệu lớn Dữ liệu lớn có 5 đặc trưng cơ bản như sau:
- Volume: khối lượng dữ liệu được tạo ra, lưu trữ và xử lý. Bao nhiêu thì là lớn? Ít nhất
nó nên được tính bằng hàng tram Terabyte, còn thông thường thì nó là Petabyte hoặc
Exabyte, thậm chí Zettabyte. Một số ví dụ: Facebook tạo ra khoảng 500TB dữ liệu mỗi
ngày, con số này ở Twitter là khoảng 8TB.
- Velocity: tốc độ dữ liệu được tạo ra. Câu hỏi cũ, bao nhiêu thì là lớn? Câu trả lời thì rất
đa dạng, vì nó phụ thuộc vào loại dữ liệu mà bạn đang xử lý, nhưng có thể lấy một vài ví
dụ trực quan của các tên tuổi lớn như 90 triệu bức ảnh được upload lên Facebook mỗi
ngày, con số cho Twitter là 500 triệu tweets được post, 0.4 triệu giờ video được upload
lên Youtube hay 3.5 tỷ lượt tìm kiếm được thực hiện mỗi ngày trên Google.
- Variety: tính đa dạng của dữ liệu. Cái này chắc dễ hiểu rồi, Big Data là không ngán
dạng nào, từ dữ liệu có cấu trúc (structure) như các bảng nơi có hàng và cột trong cơ sở
dữ liệu quan hệ RDBMS hay bảng tính excel; đến dữ liệu phi cấu trúc (unstructured) như
pf3
pf4
pf5
pf8

Partial preview of the text

Download dữ liệu lớn trong kinh tế và kinh doanh and more Slides Market economy in PDF only on Docsity!

NỘI DUNG ÔN TẬP MÔN DỮ LIỆU LỚN TRONG KINH TẾ VÀ KINH DOANH Câu 1. Phân tích các nguồn hình thành dữ liệu lớn. Tại sao lại phải quản trị dữ liệu lớn?Nguồn hình thành dữ liệu lớn Qua thống kê và tổng hợp, nguồn dữ liệu lớn được hình thành chủ yếu từ 6 nguồn:

  1. Dữ liệu hành chính (phát sinh từ chương trình của một tổ chức, có thể là chính phủ hay phi chính phủ)
  2. Dữ liệu từ hoat động thương mại (phát sinh từ giao dịch giữa 2 thực thể)
  3. Dữ liệu từ các thiết bị cảm biến như thiết bị chụp hình ảnh vệ tinh, cảm biến đường, cảm biến khí hậu
  4. Dữ liệu từ các thiết bị theo dõi vd: theo dõi dl từ đt
  5. Dữ liệu từ các hành vi vd: tìm kiếm trực tuyến, đọc các trang mạng trực tiếp
  6. Dữ liệu từ các thông tin về ý kiến, quan điểm của các cá nhân, tổ chức, trên các phương tiện thông tin xã hội  Phải quản trị nguồn dữ liệu lớn. vì tkhi quản trị dữ liệu tốt giúp các tổ chức, doanh nghiệp đạt được lợi thế cạnh tranh tiềm năng so với các đối thủ kinh doanh của họ bằng cách cải thiện hiệu quả hoạt động và cho phép ra quyết định tốt hơn. Các tổ chức có dữ liệu được quản lý tốt có thể trở nên linh hoạt hơn, nhanh chóng phát hiện xu hướng thị trường để tận dụng các cơ hội kinh doanh nhanh chóng.
  • Quản trị DL tốt cũng hỗ trợ doanh nghiệp rất nhiều trong công tác đánh giá, nghiên cứu thị trường: đánh giá hài lòng khách hàng, đánh giá năng lực nhân viên, nghiên cứu đối thủ cạnh tranh, ... Câu 2: Phân tích đặc trưng 5V của dữ liệu lớn. Nếu giả sử em là chủ sở hữu một nguồn dữ liệu của 1 tỷ người sử dụng mạng xã hội thì em sẽ có giải pháp kinh doanh hợp pháp nào từ kho dữ liệu lớn này.
  • Đặc trưng 5V của dữ liệu lớn Dữ liệu lớn có 5 đặc trưng cơ bản như sau:
  • Volume: khối lượng dữ liệu được tạo ra, lưu trữ và xử lý. Bao nhiêu thì là lớn? Ít nhất nó nên được tính bằng hàng tram Terabyte, còn thông thường thì nó là Petabyte hoặc Exabyte, thậm chí Zettabyte. Một số ví dụ: Facebook tạo ra khoảng 500TB dữ liệu mỗi ngày, con số này ở Twitter là khoảng 8TB.
  • Velocity: tốc độ dữ liệu được tạo ra. Câu hỏi cũ, bao nhiêu thì là lớn? Câu trả lời thì rất đa dạng, vì nó phụ thuộc vào loại dữ liệu mà bạn đang xử lý, nhưng có thể lấy một vài ví dụ trực quan của các tên tuổi lớn như 90 triệu bức ảnh được upload lên Facebook mỗi ngày, con số cho Twitter là 500 triệu tweets được post, 0.4 triệu giờ video được upload lên Youtube hay 3.5 tỷ lượt tìm kiếm được thực hiện mỗi ngày trên Google.
  • Variety: tính đa dạng của dữ liệu. Cái này chắc dễ hiểu rồi, Big Data là không ngán dạng nào, từ dữ liệu có cấu trúc (structure) như các bảng nơi có hàng và cột trong cơ sở dữ liệu quan hệ RDBMS hay bảng tính excel; đến dữ liệu phi cấu trúc (unstructured) như

văn bản (text), ảnh (pictures), video, audio, …; và thậm chí cả dữ liệu bán cấu trúc (semi- structure) như file json hay file xml.

  • Veracity: mức độ tin cậy của dữ liệu. Đặc tính này đi ngược chiều với các đặc tính khác của Big Data, khi khối lượng dữ liệu ngày càng tăng, tính đa dạng của dữ liệu ngày càng phong phú và tính biến thiên của dữ liệu ngày càng lớn thì mức độ tin cậy của dữ liệu ngày càng giảm xuống.
  • Value: giá trị của dữ liệu. Sẽ không thể nhắc đến Big Data nếu không thể get value từ dữ liệu. Hàng loạt các công ty đã khai thác “mỏ vàng mới” dữ liệu và phát triển mạnh mẽ: Google, Facebook, Amazon, …  Nếu giả sử em là chủ sở hữu một nguồn dữ liệu của 1 tỷ người sử dụng mạng xã hội thì em sẽ có giải pháp kinh doanh hợp pháp nào từ kho dữ liệu lớn này. Câu 3. Phân tích ứng dụng của dữ liệu lớn trong Chính phủ điện tử; Giáo dục đào tạo và Y tế thông minh. Theo em, khi chính phủ Việt Nam xây dựng xong Hệ thống Cơ sở dữ liệu quốc gia về dân cư thì sẽ có lợi ích gì cho sự phát triển kinh tế - xã hội của Việt Nam?
    • Phân tích các ứng dụng của dữ liệu lớn hiện nay. Viễn thông  Tối ưu mạng lưới: sử dụng dữ liệu mỗi ngày các nhà mạng có thể xác định các khu vực, vị trí có dung lượng vượt mức … nhằm đảm bảo chất lượng dịch vụ, tăng mức độ hài lòng của khách hàng.  Dự đoán thuê bao có khả năng rời bỏ dịch vụ: với sự hỗ trợ của các công nghệ Big Data, các nhà mạng có thể phân tích dữ liệu về chất lượng dịch vụ, sự tiện lợi của dịch vụ, mức độ tiêu dùng  Khuyến nghị sản phẩm mới: các nhà mạng có thể dựa trên sở thích, hành vi của khách hàng để xây dựng thiết kế các sản phẩm có các đặc tính phù hợp với mối quan tâm của từng lớp khách hàng Dịch vụ tài chính, ngân hàng  Phát hiện gian lận: bằng việc sử dụng Big Data, các công ty/ tổ chức tài chính có thể xác định được các mẫu biểu thị hành vi gian lận từ đó áp dụng các biện pháp cần thiết để chống lại các hành vi gian lận này.
  • Kn: Hệ quản trị cơ sở dữ liệu là một ứng dụng phần mềm máy tính, một hệ thống được thiết kế, sử dụng để tạo và quản lý một khối lượng dữ liệu nhất định trong cơ sở dữ liệu một cách tự động và có trật tự. Nhiệm vụ của chúng là cung cấp cho người sử dụng, lập trình viên và các công ty thiết kế Website một giải pháp thích hợp để họ có thể truy xuất, kiểm soát, cập nhập và tạo dữ liệu
  • 2 hệ quản trị cơ sở dữ liệu lớn phổ biến trên thế giới hiện nay mà em biết Hệ CSDL Microsoft SQL Server Microsoft SQL Server luôn luôn là một cái tên có mặt trong Top hầu hết các bảng xếp hạng hệ quản trị CSDL phổ biến nhất. Được phát triển từ năm 1989, sử dụng ngôn ngữ Assembly C, Linux, C ++, … → Một số tính năng cơ bản:  Hoạt động trên hệ điều hành Windows và Linux  Tương thích với Oracle  Cung cấp, quản lý hiệu quả khối lượng của công việc  Cho phép nhiều người dùng sử dụng chung một cơ sở dữ liệu MongoDB Nếu bạn tìm kiếm một công cụ nguồn mở được sử dụng phổ biến hàng đầu hiện nay, MongoDB chắc chắn sẽ không làm bạn thất vọng. Đây là một cơ sở dữ liệu có khả năng xử lý một lượng dữ liệu lớn, nhưng cũng đồng thời cho phép bạn sử dụng bộ nhớ trong để có thể truy cập dữ liệu một cách dễ dàng hơn. → Một số tính năng cơ bản:  Dùng cơ chế NoSQL để truy vấn, viết bằng ngôn ngữ C++  Việc chia tỷ lệ có thể thực hiện dễ dàng  Sử dụng các phép nối phức tạp không có sẵn Câu 6. Điện toán đám mây là gì? Phân tích các mô hình của điện toán đám mây. Phần mềm dưới dạng dịch vụ (SaaS) là gì, nó có những lợi ích gì đối với các tổ chức hoặc doanh nghiệp. Điện toán đám mây là việc cung cấp tài nguyên máy tính cho người dùng tùy theo mục đích sử dụng thông qua kết nối Internet. Nguồn tài nguyên đó có thể là bất kì thứ gì liên quan đến điện toán và máy tính, ví dụ như phần mềm, phần cứng, hạ tầng mạng cho đến các máy chủ và mạng lưới máy chủ cỡ lớn.  Các mô hình của điện toán đám mây Hiện nay, có 4 mô hình triển khai điện toán đám mây chính đang được sử dụng phổ biến. Đó là: Public Cloud, Private Cloud, Hybrid Cloud và Community Cloud.

1. Public Cloud Đối tượng sử dụng: Bao gồm người dùng bên ngoài internet. Đối tượng quản lý là nhà cung cấp dịch vụ.

Ưu điểm: Phục vụ được nhiều người dùng hơn, không bị giới hạn bởi không gian và thời gian, Tiết kiệm hệ thống máy chủ, điện năng và nhân công cho doanh nghiệp. Nhược điểm: Các doanh nghiệp phụ thuộc vào nhà cung cấp không có toàn quyền quản lý, Gặp khó khăn trong việc lưu trữ các văn bản, thông tin nội bộ.

2. Private Cloud Đối tượng sử dụng: Nội bộ doanh nghiệp sử dụng và quản lý Ưu điểm: Chủ động sử dụng, nâng cấp, quản lý, giảm chi phí, bảo mật tốt,… Nhược điểm: Khó khăn về công nghệ khi triển khai và chi phí xây dựng, duy trì hệ thống. Hạn chế sử dụng trong nội bộ doanh nghiệp, người dùng ở ngoài không thể sử dụng. 3. Hybrid Cloud Đối tượng sử dụng: Doanh nghiệp và nhà cung cấp quản lý theo sự thỏa thuận. Người sử dụng có thể sử dụng các dịch vụ của nhà cung cấp và dịch vụ riêng của doanh nghiệp. Ưu điểm: Doanh nghiệp 1 lúc có thể sử dụng được nhiều dịch vụ mà không bị giới hạn. Nhược điểm: Khó khăn trong việc triển khai và quản lý. Tốn nhiều chi phí.

  1. Community Cloud Là các dịch vụ trên nền tảng Cloud computing do các công ty cùng hợp tác xây dựng và cung cấp các dịch vụ cho cộng đồng.  Phần mềm dưới dạng dịch vụ (SaaS) là mô hình phân phối phần mềm và cung cấp nó dưới dạng dịch vụ. Hiểu đơn giản, nhà phát triển/nhà cung cấp tạo ra và duy trì một phần mềm cho phép truy cập dữ liệu từ bất kỳ thiết bị nào có kết nối Internet và trình duyệt web. Để sử dụng thì họ phải bỏ ra một mức chi phí nhất định - Lợi ích đối với các tổ chức hoặc doanh nghiệp: tiết kiệm chi phí, luôn được cập nhật, thuận tiện và dễ dàng sử dụng ở mọi lúc mọi nơi, có thể mở rộng quy mô dễ dàng. Câu 7. Trình bày khái niệm về IoT. Các công nghệ nền tảng cho IoT và phân tích 04 xu hướng của dữ liệu lớn và IoT. IoT là một mạng lưới mà mỗi đồ vật, con người được cung cấp một định danh của riêng mình và tất cả có khả năng truyền tải, trao đổi thông tin, dữ liệu qua một mạng duy nhất và không cần đến sự tương tác trực tiếp giữa người với người, hay với các thiết bị.  Các công nghệ nền tảng cho IoT: RFID, Sensor, Smart tech, Nano Tech.  4 xu hướng của dữ liệu lớn và IoT. - Nâng cao hiệu quả trong kinh doanh bán lẻ: hành vi mua hàng của người tiêu dùng được thu thập dễ dàng -> giúp phân tích và dự đoán hành vi mua hàng, người mua hàng dễ dàng nhìn thấy mọi sản phẩm, lên kế hoạch mua

 Quản lý các thiết bị các nhân. Câu 10: trực quan hóa dữ liệu là gì? Trình bày 5 nguyên tắc và lợi ích của trực quan hóa dữ liệu.

  • trực quan hóa dữ liệu: là sự trình bày dự liệu theo định dạng hình ảnh hoặc đồ họa để truyền đạt thông tin rõ ràng và hiệu quả cho người dùng.
  • 5 nguyên tắc và lợi ích của trực quan hóa dữ liệu
  • Nt1: xác định mục tiêu và kì vọng: trực quan hóa dữ liệu cần cung cấp một thông điệp rõ ràng và có ý nghĩa cho đối tượng sử dụng. mục tiêu, ngữ cảnh và đối tượng sử dụng kết quả theo đó cần được xác định rõ ràng trước khi trực quan hóa dữ liệu
  • Nt2: tối giản: trực quan hóa dữ liệu phải được hiện thị đơn giản đến mức các đối tượng không chuyên có thể hiểu được thông điệp cần truyền đạt,
  • Nt3: chuẩn mực cho tiêu đề và bình luận: tiêu đề và bình luận nên được sử dụng đúng lúc đúng chỗ để giúp người đọc nhanh chóng xác định thông điệp chính của báo cáo phân tích.
  • Nt4: chọn đúng công cụ: để đảm bảo có lựa chọn đúng đắn, tiết kiệm thời gian và chi phí, cần cân nhắc sử dụng tư vấn chuyên môn trước khi quyết định triển khai các công cụ và phần mềm cho đơn vị của mình.
  • Nt5: dữ liệu đầy đủ và trung thực: việc trực quan hóa dữ liệu cần cung cấp thông điệp và sự kiện chuẩn xác, dựa trên quy chuẩn đo lường phổ biến. Câu 11: Thế nào là ra quyết định dựa trên dữ liệu? Phân tích quy trình 7 bước để ra quyết định dựa trên dữ liệu
  • Ra quyết định dựa trên dữ liệu:
  • Là dựa vào những con số, bảng số liệu, các biểu đồ phân tích để đưa ra quyết định thay vì ra quyết định như cách thông thường là qua quan sát, trực giác hay cảm tính của người ra quyết định
  • quy trình 7 bước để ra quyết định dựa trên dữ liệu: Bước 1: Xác đinh được đối tượng
  • Đây là bước quan trọng, người ra quyết định phải cố gắng xây dựng 1 cách rõ ràng bản chất của quyết định mình cần đưa ra, phạm vi ảnh hưởng
  • Xác định được các bằng chứng cụ thể, có thể đo lường dc khi thực hiên quy định Bước 2: Xây dựng các giả thuyết
  • Xác định phạm vi tác động lớn nhất có thể quyết định khi có sự nỗ lực của mọi người cho quyết định đó
  • Đưa ra các câu hỏi quan trọng dưới dạng 1 giả thuyết nếu – thì có thể chứng minh hoặc bác bỏ Bước 3: Xác định dữ liệu cần thiết
  • Là định tính hay định lượng
  • Có bao nhiêu nguồn để thu nhập dữ liệu. Mất bao lâu để lấy dữ liệu Bước 4: Xây dựng quá trình xử lí dữ liệu
  • Nơi nào có thể lấy dữ liệu, Ngân sách, Nhà cung cấp dịch vụ Bước 5: Thu nhập dữ liệu
  • Chỉ định ai là người thu nhập và quản lí dữ liệu
  • Xây dựng quy trình và giao thức để thu nhập dữ liệu, làm sạch và xử lí sơ bộ dữ liệu Bước 6: Phân tích số liệu – kiểm định lại các giả thuyết ở bước lập mô hình các kịch bản khác dựa trên sự thay đổi của các bước trong dữ liệu thu thập dc Bước 7: Ra quyết định – trong bước này người ra quyết định có thể trình bày có phát hiện của mình bằng hình ảnh hoặc đồ họa, từ đó đưa ra quyết định cũng như kế hoạch để triển khai quyết định đó. Câu 12. Trình bày 5 phương pháp để ra quyết định. Lấy ví dụ minh họa.
  • Phương pháp độc đoán
  • Phương pháp phát biểu cuối cùng
  • Phương pháp cố vấn
  • Phương pháp đa số
  • Phương pháp dựa trên đánh giá Trong thực tế cuộc sống em đã đưa ra rất nhiều quyết định quan trọng, và điển hình là việc đưa ra quyết định chọn trường đại học, trường Học viện chính sách và phát triển. quyết định chọn trường đại học em dựa trên phương pháp dựa trên đánh giá, Vì khi chọn trường đại học em đã tham khảo rất nhiều trang thông tin, qua nhiều đánh giá của mọi người, em đã quyết định chọn trường Học viện Chính sách và phát triển vì em nghĩ đó là một ngôi trường phù hợp với bản thân em.