Tìm hiểu hơn 1,000 thuật ngữ kinh tế được giải thích dễ hiểu và những khóa học về kinh tế tài chính. Đăng ký ngay để được miễn phí giải đáp câu hỏi về tài chính kinh tế!

Thống kê (Statistics)

Thống kê (Statistics)

Thuật ngữ “thống kê”, tên tiếng Anh “statistics” có gốc từ “state” (quốc gia), gốc La tinh “statisticum collegium” (hội đồng quốc gia). Theo tiếng Đức, “statistik” có nghĩa gốc là “công tác dữ liệu của quốc gia”. Vì thế, tác phẩm đầu tiên của thống kê do John Graunt xuất bản năm 1663 liên quan đến các khảo sát về dân số.

Này nay, thống kê đã có nhiều sự thay đổi và đã được phổ biến rộng rãi. Vậy thống kê là gì, ứng dụng cũng như công cụ được sử dụng phổ biến trong thống kê gồm những gì?

Khái quát về thống kê


Thống kê là một dạng phân tích toán học bao gồm thu thập dữ liệu, sử dụng mô hình phân tích và suy luận ra kết quả, từ đó đưa ra được những mối liên hệ giữa các con số trong thực tế và dự đoán cho tương lai

Hai phương pháp thống kê thường được sử dụng là thống kê mô tả (descriptive statistics) và thống kê suy luận (inferential statistics)

  • Thống kê mô tả: là thu thập và nghiên cứu dữ liệu về một đối tượng cần tìm hiểu, từ đó đưa ra mô tả về các đặc điểm của dữ liệu thu thập được (giá trị trung bình, giá trị phổ biến nhất, mối quan hệ giữa các dữ liệu) từ đó hiểu thêm về dữ liệu. Ví dụ như khi sử dụng phương pháp thống kê mô tả cho dân số Việt Nam, ta có thể biết được những đặc điểm dân số như độ tuổi trung bình, tỷ lệ dân số trẻ, dân số già trên tổng dân số,...

  • Thống kê suy luận: sử dụng một mẫu dữ liệu nhỏ trong một đối tượng dữ liệu lớn cần tìm hiểu, sau đó tìm ra các đặc điểm của mẫu dữ liệu nhỏ để từ đó suy ra được đặc điểm của tập dữ liệu lớn hơn. Lúc này, những kết luận thu được không chỉ đơn thuần là mô tả dữ liệu sẵn có nữa mà đã suy luận ra tính chất của phạm vi rộng hơn.\


Ứng dụng của thống kê


Thực tế, thống kê được ứng dụng trong hầu hết các hoạt động từ kinh tế, khoa học, xã hội và được sử dụng rộng rãi từ cá nhân (thống kê chi tiêu sinh hoạt, mua sắm, thu nhập), đến tổ chức (thống kê hiệu quả công việc, nhu cầu thị trường) và chính phủ (thống kê dân số, vốn đầu tư, tăng trưởng kinh tế ở các tỉnh thành),...

Đặc biệt, trong lĩnh vực kinh tế và tài chính, thống kê được xem là một phương pháp quan trọng để thu thập và xem xét dữ liệu như GDP, đầu tư, tiêu dùng đến tỷ lệ lạm phát. Trong lĩnh vực đầu tư tài chính, các nhà phân tích và nhà đầu tư sẽ thu thập dữ liệu về công ty, ngành, dữ liệu thị trường chứng khoán về giá cả và khối lượng giao dịch. Số liệu thống kê có thể được sử dụng để đưa ra các quyết định quan trọng cho hoạt động đầu tư và kinh doanh.


Công cụ được sử dụng phổ biến trong thống kê


  • Giá trị trung bình (Mean): là giá trị bình quân của mẫu dữ liệu thu thập được. Giá trị trung bình thường được coi như một đại diện quan trọng của mẫu dữ liệu vì chúng là “trung bình” của các số, tức không quá cao cũng không quá thấp và do đó có thể cho một cái nhìn tương đối về mẫu dữ liệu. Ví dụ, độ tuổi trung bình của Việt Nam năm 2020 là 32.9 tuổi, có nghĩa là phần lớn dân số của Việt Nam đã ở khoảng giữa của độ tuổi lao động nhưng cũng sẽ sớm bước sang độ tuổi già trong những năm tới. Giá trị trung bình thường được xác định bằng trung bình cộng (Arithmetic Mean) và trung bình nhân (Geometric Mean), có công thức như sau:

Trung bình cộng : giá trị được tính bằng tổng của những giá trị trong dữ liệu chia cho số lượng mẫu được thu thập trong chuỗi giá trị đó.

Trung bình nhân được tính bằng căn bậc x của tích những giá trị trong dữ liệu. Trong đó x là số lượng mẫu được thu thập trong chuỗi giá trị đó



  • Phương sai (Variance): đo mức độ chênh lệch giữa các giá trị trong mẫu dữ liệu bằng cách so sánh từng giá trị đó với giá trị trung bình của mẫu (mean). Phương sai là một phương pháp xác định rủi ro trong tài chính, vì theo các nhà kinh tế học, nếu giá trị của một tài sản có biến động quá lớn so với mức trung bình trong một thời gian ngắn thì việc đầu tư vào tài sản đó sẽ chứa đựng nhiều rủi ro (rủi ro thua lỗ lớn và khó dự đoán trước xu hướng). Cũng như vậy, nếu một đất nước có mức tăng trưởng cao nhưng biến động mạnh so với mức trung bình (phương sai lớn) thì có nghĩa là nền kinh tế đó rất mỏng manh và tăng trưởng kinh tế khó duy trì bền vững, cho nên sẽ thu hút được ít vốn đầu tư hơn một đất nước có mức tăng trưởng thấp nhưng phương sai nhỏ hơn.


  • Độ lệch (Skewness): đo lường sự bất đối xứng (biến dạng) dưới dạng biểu đồ hình chuông thể hiện tần suất của mỗi dữ liệu trong một mẫu nghiên cứu . Trong đó trục hoành là giá trị của dữ liệu, trục tung là tần suất xuất hiện của dữ liệu đó. Dữ liệu nào xuất hiện càng nhiều thì tần suất càng lớn và đỉnh của hình chuông sẽ tập trung tại đó. Sau đó, dựa vào điểm trung bình (mean) của dữ liệu (điểm giữa của trục hoành), ta sẽ xác định được đây là mô hình phân bố lệch phải (dương), lệch trái (âm), hoặc cân đối (bằng không). Có rất nhiều ứng dụng của độ lệch trong thực tế, sẽ được đề cập chi tiết hơn trong phần định nghĩa về độ lệch.


  • Độ nhọn (Kurtosis): đo lường mức độ khó dự đoán và rủi ro của một mẫu dữ liệu khi xem xét hình dạng của biểu đồ tần suất dữ liệu có ít khác biệt hay nhiều khác biệt so với biểu đồ phân phối chuẩn (đỉnh nhọn hơn, giống chuẩn hay đỉnh dẹt hơn). Các tập dữ liệu có độ nhọn lớn (high kurtosis), tức là trong mẫu sẽ có một giá trị xuất hiện nhiều hơn hẳn những giá trị còn lại, tiềm ẩn rủi ro cao (dữ liệu khó dự đoán, mức độ dao động giữa các dữ liệu cũng lớn hơn). Thử tưởng tượng trong 5 năm, một cổ phiếu liên tục tăng trưởng 10% trong 3 năm liên tiếp (tần suất của 10% xuất hiện nhiều nhất), sau đó 2 năm còn lại đột nhiên tăng trưởng âm 20% và âm 10%. Lợi nhuận của cổ phiếu này sẽ bất ổn và khó dự đoán hơn nhiều so với một cổ phiếu hàng năm có dao động lợi nhuận bình bình quanh ngưỡng -5% đến 5% (đỉnh phân phối dẹt hơn, số lần xuất hiện của mỗi mức lợi nhuận gần tương đương nhau và khoảng cách giữa những lần dao động sát nhau). Do đó, độ nhọn cũng là phương pháp thống kê thể hiện mức độ rủi ro và tính chất khó dự đoán của một mẫu dữ liễn




  • Phân tích hồi quy (Regression analysis): quan sát mối quan hệ giữa các biến số (ví dụ như GDP, lạm phát, tăng trưởng dân số) thông qua phương trình phù hợp. Phân tích hồi quy trong tài chính thường được sử dụng để xác định mức độ mà các yếu tố cụ thể như lãi suất, giá của sản phẩm hoặc dịch vụ, hoặc các ngành, hoặc các lĩnh vực cụ thể ảnh hưởng đến biến động giá của một tài sản. Điều này được mô tả dưới dạng một đường thẳng hai trục x, y (thể hiện hai biến liên quan tới nhau) gọi là đường hồi quy tuyến tính.