AI | 懶泥陳的閱讀書房

#160《哈佛商業評論推薦必讀AI趨勢》深入剖析AI轉型、發展

2024 年 7 月 23 日 by lenny chen Leave a Comment

隨著人工智慧（AI）的快速發展，它已經成為影響當代企業經營和職場工作的重要趨勢。

《哈佛商業評論推薦必讀AI趨勢》一書，集結了來自《哈佛商業評論》的精選文章，從多個維度分析了AI轉型對企業和員工的影響。

將深入探討這本書的核心觀點和實際應用，並討論AI在不同領域的適用性、對在職學習的衝擊、缺乏主觀判斷的問題，以及AI的道德倫理問題。

AI轉型對企業的影響

當大家都在用AI 時，你的企業可以怎麼運用 AI?

AI轉型已經成為當代企業競爭的一個重要維度。

AI技術的應用不僅可以提高企業運營效率，還能創造新的商業模式和價值主張。

從《哈佛商業評論推薦必讀AI趨勢》一書中可以看出，AI轉型對企業經營的影響是全面而深遠的。

優勢

效率的顯著提升：AI技術可以自動化許多重複性高的工作，從而釋放人力資源，允許員工專注於更有創造性和戰略性的任務。
數據驅動的決策制定：透過AI的資料分析能力，企業能夠基於更精確的數據進行決策，提升決策的準確性與時效性。
開發新的商業模式：AI的應用開拓了新的商業模式，例如智慧家居、個性化推薦系統、自動駕駛等，為企業帶來新的收入來源。

挑戰

對人才的需求轉變：AI轉型要求企業擁有能夠設計、開發和維護AI系統的技術人才，這對人才培養和招聘策略提出了新的要求。
組織文化的變革壓力：企業需要培養一種以數據和技術為中心的組織文化，這可能會遇到來自傳統思維和工作方式的阻力。
安全和隱私問題：隨著AI在企業中的深入應用，數據安全和隱私保護變得越來越重要，這需要企業投入更多資源來確保。

AI轉型對職場工作的影響

AI轉型不僅改變了企業的運營模式，也對職場工作帶來了顯著的影響。

AI在自動化和增強工作流程中的應用，正在重新定義工作的性質和工人的角色。

[閱讀全文…]

AutoEncoder 自動編碼器來建構生成模型

2022 年 3 月 23 日 by lenny chen Leave a Comment

對於像是把一個數字變成一個影像的作法，通常是透過生成模型來達成， AutoEncoder 自動編碼器則是深度學習中常見最簡易的生成模型。

AutoEncoder 的運作原理

AutoEncoder 是透過一個 Encoder 編碼器與一個 Decoder 解碼器的組合來實作生成模型的機制。

編碼的過程有點像是將資料濃縮、擷取，降維到較小維度的空間，而解碼則是相反的過程，類似於將較小維度空間的資料重建、還原、升維到原始維度的空間。

在 AI 的領域中，這種濃縮的資訊通常以 z 來表示， z 所存在的空間稱為潛在空間。

AutoEncoder 模型在訓練好之後，只需要將 Encoder 移走，透過給予 Decoder 解碼器隨機潛在空間的值，就可以生成所需要的影像。

換句話說，在 AutoEncoder (AE) 架構中，通常最後在使用的部分都是已經訓練完成的 Decoder 解碼器。

[閱讀全文…]

AutoKeras 的模型搜尋行為

2022 年 3 月 11 日 by lenny chen Leave a Comment

AutoKeras 之所以方便使用而且將 AI 的模型訓練降低門檻到幾乎人人都可以上手，主要就是在於自動化的進行模型搜尋，透過自動化的方式去尋找、找出最合適的演算法跟模型來訓練 AI。而這也就是 AutoKeras 的命名來源，取代原本需要透過資料工程師手動的調教、訓練模型。

AutoKeras 是如何進行模型的搜尋行為的 ?

[閱讀全文…]

如何檢視 TensorFlow 資料集中的資料 ?

2022 年 3 月 11 日 by lenny chen Leave a Comment

如果是 Tensorflow Datasets 的資料集可以利用內建的 info 功能去顯示資料集的範例。

[閱讀全文…]

AutoKeras 可接受的輸入資料格式

2022 年 3 月 10 日 by lenny chen Leave a Comment

AutoKeras 模型一般可以接受輸入下面四種類型的資料

Numpy 陣列 (ndarray)

Numpy、scikit-Learn、Tensorflow 等 Python 套件都採用的陣列，只要電腦的記憶體可以容納得下你的資料，儲存成 ndarray 是最便利的選擇。

Pandas 的 Series/ DataFrame 物件

Pandas 也是常用的資料套件，可以用來載入 CSV、Excel 資料表，其中內建的 DataFrame 可以直接輸入給 AutoKeras 模型不需要額外轉換成 Numpy 物件。

TensorFlow Core 資料集

可以直接透過TensorFlow Core 中的預設 Module資料集下載資料並直接傳給 AutoKeras 圖形分類器訓練，這種形式的資料集相對比較少，但所有的資料集都已經預處理好了，很適合學習使用。

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
import autokeras as ak

from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import load_model

(x_train, y_train) , (x_test, y_test) = mnist.load_data()

print(x_train.shape)
# 建立圖形分類器
clf = ak.ImageClassifier(max_trials = 1)

# 開始訓練圖形分類器
clf.fit(x_train, y_train, epochs = 10)

# 使用測試集評估模型的預測效果, 會回傳預測的準確率
clf.evaluate( x_test, y_test )

TensorFlow 資料集

有許多公開的資料集可以用來學習以及練習，這個有點類似 Python 生成器，能以串流形式從硬碟檔案或分散式檔案系統傳入資料，因此很適合用在深度學習與大型的資料集。

TensorFlow DataSets 官方內建資料集列表

基本上大型的資料集，比較建議先將資料轉換成 TensorFlow Dataset，也就是將自己的資料寫成 TensorFlow 資料集的格式，官方的文件有詳細的作法，可以參考。

將資料轉換成 TensorFlow 資料集有幾個好處 :

可以非同步預處理與建立資料佇列。
提供 GPU 記憶體資料預載，所以在GPU處理完前一批資料後，可以直接使用下一批。
可以從多種不同的資料源載入資料 ex. CSV 、Numpy、文字檔、資料夾等

使用前請先記得安裝 package

使用 TensorFlow Datasets 的下載方式與上面的稍微有些不同，下面是參考的範例程式碼

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

import tensorflow_datasets as tfds
import autokeras as ak

mnist_train, mnist_test = tfds.load('mnist', split=["train","test"], as_supervised=True)

ak0 = ak.ImageClassifier(num_classes=10, max_trials=1)
ak0.fit(mnist_train, epochs=10)

# 使用測試集評估模型的預測效果, 會回傳預測的準確率
ak0.evaluate( mnist_test )