Big Data (Dữ Liệu Lớn) sẽ thay đổi ngành An Ninh như thế nào ?


Figure 1, National Facility Entries by Time Zone

Trong phần đầu tiên của loạt bài này (được công bố vào tháng 4 năm 2013) chúng tôi đã đề cập đến một vài công nghệ chính yếu sẽ góp phần trong việc ứng dụng của Big Data vào việc thực hành an ninh vật lý. Chúng tôi đưa ra một vài kết luận:

Big Data là hoàn toàn phù hợp cho công nghệ điện toán đám mây do không giới hạn các nguồn yêu cầu.

Tỷ lệ hoàn vốn (Return On Investment – ROI) đến từ những cái nhìn chuyên sâu không thể có trước đó trên những tập dữ liệu nhỏ hơn hoặc các máy chủ địa phương.

Bên cạnh những lợi ích kinh tế, nó có tiềm năng thực sự trong việc nâng cao tính an sinh và bảo vệ tài sản với khả năng phân tích thời gian thực.

Trong bài viết này, chúng tôi xem xét một số ví dụ cụ thể về việc làm thế nào công nghệ Big Data có thể đem lại lợi ích trong các lĩnh vực phân tích. Lưu ý rằng những ví dụ này chỉ là bề nổi của tảng băng. Chúng chỉ minh họa cho những gì có thể được thực hiện. Chúng tôi bị giới hạn chỉ bởi khả năng tưởng tượng còn hạn hẹp của mình.

Những tập dữ liệu cho các ví dụ này rút ra từ ba lĩnh vực khác nhau. Hai lĩnh vực đầu sẽ khá quen thuộc đối với những người đứng đầu bộ phận an ninh doanh nghiệp: kiểm soát truy nhập (access control) và phân tích hình ảnh video (video analysis). Cả hai cung cấp lượng lớn dữ liệu chứa rất nhiều mặt khuất cũng như những nhận định tiên đoán. Nguồn dữ liệu thứ 3 là thứ có thể khiến bạn ngạc nhiên: các file log từ các máy chủ Web.

Thống kê số đông vs. Phân tích địa phương

Những ví dụ về các phân tích ở đây được rút ra từ hai khu vực khác nhau. Đầu tiên là những khu vực tập trung người sử dụng lớn và các cơ sở nhà máy, những người ở đó có thể có hoặc không có quan hệ với nhau, nhưng dù sao thì cũng có tương quan với nhau do những yếu tố bên ngoài như vị trí địa lý, loại hình kinh doanh, thời điểm trong năm, v.v.. Chúng tôi gọi đó là “thống kê số đông”. Thứ hai dựa vào loại dữ liệu là địa phương cho một tổ chức hay thậm chí một cơ sở đơn lẻ, nhưng có thể hưởng lợi từ những phân tích mạnh mẽ cung cấp trong một phạm vi Big Data. Chúng tôi sẽ gọi chúng là “phân tích địa phương”.

Việc sử dụng các “thống kê số đông” cho thấy một thực tế rằng các hệ thống an ninh tạo ra một lượng lớn dữ liệu có giá trị về mặt kinh doanh và xã hội vượt xa hơn hiện tại chỉ sử dụng trong việc quản lý an ninh. Tuy nhiên, với các thế hệ sản phẩm truyền thống của một hệ thống an ninh cho mỗi tòa nhà hay thậm chí cho mỗi một doanh nghiệp, các tập hợp dữ liệu cũ chưa bao giờ đủ lớn để hỗ trợ phương thức phân tích này. Ngày nay, với việc ngày càng nhiều các hệ thống an ninh hoạt động trên phạm vi rộng lớn hơn, các hệ thống được kết hợp lại trên công nghệ đám mây, các tập dữ liệu phong phú và có giá trị hơn. Các công cụ chúng tôi đã đề cập trong phần đầu tiên cho phép chúng ta nhận ra giá trị này.

Các phân tích địa phương đem lại sự thấu hiểu cặn kẽ dữ liệu cụ thể của các cơ sở hoặc công ty, nhưng làm như vậy với các công cụ thường chỉ dành cho những vấn đề lớn hơn nhiều. Điều đó đồng nghĩa với việc sức mạnh xử lý điện toán lớn hơn và càng nhiều thuật toán phức tạp hơn tạo áp lực cho mục tiêu hạ thấp chi phí. Một lần nữa, lợi ích này có khả năng được là nhờ kiến trúc công nghệ điện toán đám mây tận dụng tính kinh tế của các khu vực và cung cấp những khả năng mà nói một cách đơn giản là chúng không khả thi trên các loại server máy chủ thường kết nối với các hệ thống an ninh. Như những gì Microsoft Research đã quan sát thấy, “Big Data khá bất tiện. nó quá lớn để có thể vừa vặn trong một màn hình, hay trong bộ nhớ, đĩa ghi.”

Big Data trong hoạt động: Khi nào mọi người đi vào làm việc?

Một ví dụ đơn giản về thống kê số đông đó là sử dụng công nghệ Big Data để trả lời một câu hỏi dường như đơn giản, khi nào thì mọi người đi vào làm việc? Câu trả lời phụ thuộc vào nhiều yếu tố, nhưng có một giả thuyết chúng ta có thể kiểm nghiệm là liệu có bất kỳ sự khác biệt đáng kể nào về thời gian tới (arrival time) dựa vào múi giờ của khu vực. Để có được điều này, chúng tôi đã kiểm tra một tập dữ liệu của khoảng hai triệu sự kiện truy cập giấu tên trong một ngày làm việc trong năm. Tiến hành phân tích tương tự trong một năm sẽ chiếm khoảng một tỷ điểm dữ liệu – nhiều hơn hẳn hệ thống an ninh điển hình được thiết kế để xử lý.

Hình 1 (xem hình 1, trang 30) cho thấy tập dữ liệu này dưới dạng một biểu đồ của thời gian tới tại ba múi giờ chính nước Mỹ. Ba đường biểu diễn hoạt động thể hiện cho mỗi múi giờ có thể nhận thấy rõ ràng, và mốc thời gian đường biểu diễn là mỗi một tiếng đồng hồ, theo như mong muốn.

Mọi thứ sẽ trở nên thú vị hơn khi chúng ta đào sâu vào để hiểu thêm về các dữ liệu và xem xét các thống kê về các mốc thời gian tới mỗi buổi sáng tại mỗi múi giờ. Như đã thể hiện trong Hình 2 (xem hình 2, trang 30), sự khác nhau giữa mỗi vùng hiển hiện ở thời gian tới trung bình, nhưng chúng ta chỉ có thể thấy điều này khi dữ liệu được kết hợp lại qua một tập hợp đầy đủ được trình bày bằng thống kê.

Làm sao một doanh nghiệp có thể sử dụng tính chuyên sâu này? Một điều, có thể đưa ra giả thuyết – xin lỗi những ai là cư dân California – nếu bạn muốn có một lực lượng lao động đúng giờ, mở một văn phòng ở vùng Trung Tây nước Mỹ. Dữ liệu chỉ ra rằng các nhân viên ở múi giờ khu vực Trung Mỹ đến sớm hơn trung bình cỡ 30 phút so với các đồng nghiệp ở phần còn lại của đất nước. Nhìn chung, tuy là dữ liệu cho thấy điều đó các vùng có vẽ giống nhau nhiều hơn là khác. Hình dạng của biểu đồ hoạt động tương đồng nhau thấy rõ tính trong phạm vi cả ngày, cho thấy các dòng tương tự, thời gian nghĩ giữa ngày, và sự kết thúc sau đó.

Nếu có một điều nào đó mà các phân tích Big Data chỉ ra cho chúng ta, điều đó là dữ liệu tạo ra vì một mục đích để có thể đạt giá trị cao hơn cho nhiều ứng dụng khác nhau. Loại phân tích này được biểu hiện trong Hình 2 có thể được mở rộng ra để xem xét những sự đổi khác mỗi ngày trong tuần hoặc tháng, hoặc lớn hơn là theo mùa. Những kết quả này có thể lần lượt cung cấp những thông tin giá trị để hiểu rõ hơn về các nhân viên, việc giao thông đi lại, thuê văn phòng, và nhiều hơn thế nữa. Những câu trả lời ở đây cho những người có câu hỏi, và họ sẽ không phải là tất cả người dùng hệ thống an ninh.

Có bao nhiêu người của tôi đang hiển thị?

Nếu bạn cung cấp hệ thống an ninh cho một cơ sở, trường học, hay một dây chuyền toàn quốc các văn phòng, một yếu tố quan trọng bạn cần phải hiểu đó là có bao nhiêu người đang truy nhập vào cơ ngơi của bạn bất kỳ vào ngày nào. Hiểu về những sự khác nhau cả về vùng và mùa cũng đều quan trọng, cũng như bất kỳ thay đổi về lịch sử nào.

Để có được các nhìn cao nhất về những phân tích tập hợp này, chúng ta xem xét một mẫu sự kiện cho khoảng bốn triệu người sử dụng giấu tên trong một ngày. Chúng tôi sau đó đã tạo ra một tần số sự phân bố số lần mỗi người sử dụng truy nhập một hoặc nhiều cửa trong cơ sở của họ (xem Hình 3). Điều này cho chúng tôi biết mức độ hoạt động trong ngày. Chúng tôi nhận ra rằng nhóm lớn nhất – khoảng hơn một triệu người – là những người không bao giờ sử dụng những tấm thẻ của họ ở tất cả các ngày đã phân tích. Ngoài ra còn có một số ít người đi qua một cánh cửa đến hơn 400 lần trong một ngày, thật đáng kinh ngạc. (Thật khó để biết được làm sao họ khiến cho mọi công việc được thực hiện, nhưng đó là một câu hỏi khác)

Thật dễ dàng để xem xem liệu làm thế nào mà những người chủ các cơ sở và những người khác có thể thu được lợi ích từ những loại dự liệu này. Ví dụ, khi biết rằng khoảng 1/4 số người không xuất hiện trong bất kỳ ngày nào có nghĩa là bạn có thể ở không gian văn phòng chỉ định hoặc các tòa nhà khác. Có lẽ đó là thời điểm cho loại hình văn phòng Hoteling thay vì không gian văn phòng được giao. Tương tự, các cơ sở thể hiện mức độ hoạt động thấp hơn hoặc cao hơn so với mức này có thể có yêu cầu an ninh hoặc bảo trì đặc biệt . Ở cấp thành phố, loại dữ liệu này có rất nhiều điều để nói về giao thông, đậu đỗ xe và quy hoạch thành phố.

Tuần này là bình thường hay bất thường?

Một trong những lợi ích lớn nhất từ những tập dữ liệu khổng lồ và những công cụ phân tích mạnh mẽ là khả năng nhận biết các mảng dữ liệu, và hiển thị khi có những trường hợp không hợp lệ. Trong ví dụ sau đây, chúng tôi sử dụng phân tích theo chiều dọc của một năm dữ liệu để tìm các mảng mà có thể được so sánh với hiện tại.

Hình 4 (xem hình 4, trang 31) dựa trên lịch sử các phân tích hình ảnh qua video trên nền tảng công nghệ điện toán đám mây cung cấp bởi các camera giám sát trong một chương trình thiết lập văn phòng thương mại. Phần mềm phân tích dữ liệu trong trường hợp này thành lập một đường cơ sở dao động bình quân của mức độ hoạt động theo dõi bởi camera (đường màu xanh). Sau đó nó chèn lên những mức độ sự kiện quan sát của một tuần bất thường lên phía trên của mẫu quá khứ cho địa điểm này (đường màu xanh). Câu hỏi đặt ra là, tại sao tuần này lại bận rộn hơn so với bình thường? Một câu hỏi tốt hơn có thể là, có ai đã phát hiện ra tuần này là một tuần không bình thường mà không nhờ sự trợ giúp của những phân tích của Big Data không? So sánh những cái nhìn chuyên sâu với những gì có thể nhìn thấy bằng “mắt thường” hay những chức năng báo cáo thường dùng có sẵn trong các hệ thống an ninh khu vực.

So sánh các tài sản của tôi như thế nào?

Một trong những câu hỏi thường gặp nhất trong môi trường doanh nghiệp đó là, làm thế nào để so sánh các cơ sở nhà máy của tôi? Câu hỏi này thường xuyên là đề tài của việc so sánh cửa hàng này với cửa hàng kia trong ngành bán lẻ, đó là một ví dụ, tuy nhiên cũng chỉ có thể áp dụng bất cứ lúc nào có số lượng lớn các cơ sở mang theo cùng một tấm chắn an ninh. Hiểu rõ lượng lớn dữ liệu trong một chương trình nền tảng có khả năng phân tích cung cấp cái nhìn chuyên sâu mà sẽ không khả thi cho đến khi các dữ liệu được kết hợp vào một hệ thống với tốc độ và sức mạnh để đưa ra các câu trả lời kịp thời.

Hình 5 (xem hình 5, trang 31) thể hiện các sự kiện an ninh tại bốn khu vực khác nhau trong cùng một doanh nghiệp. Trong trường hợp này, sự biểu diễn dữ liệu cho thấy ngay rằng tất cả bốn bộ phận này thể hiện tương tự sự chuyển dịch các sự kiện an ninh. Không đâu trong số đó thực sự nổi bật – và đôi lúc đó là tất cả những gì bạn cần biết. Bí quyết ở đây là cung cấp hiểu biết đó một cách nhanh chóng, theo đúng yêu cầu thực tế, không có người sử dụng buồn chán hay tình trạng IT rắc rối.

Làm thế nào so sánh năm này với năm kia?

Các công ty thường muốn đánh giá hiệu quả của các sáng kiến mới để xem nếu chúng có một tác động tích cực đến kết quả. Một lần nữa, hiển thị của Big Data làm cho một quá trình đơn giản mà nhanh chóng mang lại kết quả cho các tập dữ liệu lớn. Hình 6 (xem hình 6, trang 31), 2012 rõ ràng có tỷ lệ rủi ro thấp hơn 2011. Một phân tích đa chiều có thể mở rộng về kỹ thuật này để so sánh những thay đổi trong nhiều bộ phận trải qua những cải tiến tương tự.

Cải tiến trải nghiệm người dùng

Trước đó, chúng tôi đã chỉ ra rằng một nguồn dữ liệu bất thường trong lĩnh vực an ninh là những file log từ các máy chủ Web. Cái bất thường là nó không phải là dữ liệu an ninh cho mỗi gia nhập. Thay vào đó, đối với các hệ thống an ninh theo công nghệ điện toán đám mây (hoặc bất kỳ trình duyệt giai đoạn bắt đầu hổ trợ các hệ thống), dữ liệu đại diện cho hành vi của các nhân viên an ninh thực sự sử dụng hệ thống để tiến hành công việc của họ.Tại sao điều này lại quan trọng? Trong một thế giới nơi các công ty Web phát triển theo định hướng người tiêu dùng nghiên cứu hành vi người dùng trực tuyến để cải thiện các ứng dụng của họ, những khách hàng hệ thống an ninh dường như là cuối cùng trong giới hạn đối với khía cạnh này trong cải tiến của User Experience (UX). Đó là một thiệt hại cho cả khách hàng của chúng tôi và những người chúng ta bảo vệ. Một ví dụ đơn giản của các loại dữ liệu chúng tôi có thể trích xuất từ một vài tỷ nhấp chuột vào web là để hiểu được các hoạt động được thực hiện thường xuyên nhất của các nhà quản lý an ninh, vì vậy, chúng ta nên tập trung cải thiện trải nghiệm người dùng của chúng tôi . Hình 7 (xem Hình 7 , trang 31) đúc rút giá trị của một năm về hành vi của khách hàng online vào năm hành động an ninh phổ biến nhất được thực hiện .

Chúng ta hướng đến đâu từ xuất phát điểm hiện tại?

Các ví dụ đã trình bày ở đây là tất cả hồi tưởng mà chúng tôi đã biên soạn và phân tích các sự kiện đã xảy ra. Như đã đề cập trước đây, chúng chỉ lướt sơ qua phần bề mặt, và bị giới hạn chỉ nằm trong trí tưởng tượng của chúng tôi.

Thời gian tới, chúng tôi sẽ xem xét giá trị ước đoán của các thông tin an ninh trong một bối cảnh Big Data. Sau tất cả, thật tuyệt khi hiểu rõ về quá khứ, nhưng mục đích thực sự của chúng tôi là để hiểu và thay đổi tương lai.

 

Để lại Comment

Your email address will not be published. Required fields are marked *

FREE DOWNLOADS!
Chúng tôi hiện có nhiều Ebook (cả tiếng Anh lẫn tiếng Việt) liên quan đến các lãnh vực điều khiển chiếu sáng, HVAC, Security, BMS, Tiết Kiệm Năng Lượng...cũng như các Tools, Software, Reports...Tất cả đều có thể DOWNLOAD MIỄN PHÍ. Bạn có muốn xem qua?
Free Ebook
NEW EBOOK
Nhiều E-book mới, hay, hữu ích và miễn phí download chúng tôi vừa mới chia sẻ trong kho Resource. Bạn có muốn xem qua?