Intel Math Kernel Library v10.2.4.032 LINUX 英文正式版(創建數位密集型類比和分析應用的軟體庫)
碟片編號:CB17527
碟片數量:1片
銷售價格:80
瀏覽次數:25088
破解說明:安裝完成後,請將光碟 \crack 目錄下的檔案,複製到主程式的
安裝目錄內中,並覆蓋,即可破解!
Register with given license.
軟體簡介:
Intel Math Kernel Library v10.2.4.032 LINUX 英文正式版(創建數位密集型類比和分析應用的軟體庫)
最新發行!這是一種幫助開發商創建數位密集型類比和分析應用的軟體庫,支援基
於英代爾奔騰4、英代爾奔騰3、英代爾至強和英代爾安騰2處理器的系統。這一全
新的軟體庫將幫助開發商簡化開發工作,並提高跨多個英代爾架構系統的應用性能。
Intel Math Kernel Library 是可重複使用的線性代數、快速富立葉變換及向量數
學(Vector Math)和統計函數的集合,帶有通用應用編程介面。一個庫就是一組
預先構建的編程代碼,開發人員在編寫應用時可以進行 調用 。Intel Math Kernel
Library使開發人員只需編寫一次代碼,即可獲得跨眾多英代爾架構系統的性能優
勢。該庫設計適合於數學密集型應用,如財務建模和地質勘測分析軟體。
Intel性能原件庫能有效地降低開發和維護成本。IntelIntegrated Performance
Primitives Library(Intel集成性能原件庫)是跨平臺的軟體庫,內含的一組多媒
體功能可以幫助聲音/視頻代碼以及圖像/信號處理等代碼提高運行效率。IntelMath
Kernel Library(Intel數學核心庫)提供了線性代數、快速傅利葉變換,向量等數
學功能,能有效提高金融、科學計算、工程軟體的性能。
英代爾 數學核心函數庫(英代爾 MKL)提供經過高度優化、擴展地線程處理的數
學常式,它們專門針對性能要求很高的科學、工程及金融等領域的應用程式而設計。
產品簡介 [PDF 932 KB]
特性
英代爾 處理器上的卓越性能
在基於英代爾 安騰 2、英代爾 至強 以及英代爾 奔騰 4 處理器的系統上,利用
經過高度優化的數學函數庫實現了卓越的性能。英代爾 MKL 的性能可與非英代爾
處理器上其他數學套裝軟體的性能相媲美。
多核準備
‧ 多處理器系統上出色的可伸縮性1
憑藉英代爾 MKL 內置的並行性可在多處理器上獲得出色的可伸縮性。英代爾 MKL
3 級 BLAS 和快速傅立葉變換利用 OpenMP* 支持線程。
‧ 線程安全
所有的英代爾 MKL 函數都是線程安全的。
自動運行時處理器檢測
執行運行時檢查,從而可執行處理器專用優化代碼,確保您的應用程式無論在哪種
系統上執行都能實現最佳性能。
支援 C 和 Fortran 介面
與其他一些要求您購買多個產品才能獲得 C 和 Fortran 介面的數學庫不同,英代
爾 MKL 將這兩種介面都包含在內。
一個套裝軟體支持所有的英代爾 處理器
如使用其他的數學庫,則需要購買多個產品來支援英代爾 安騰 2、至強 以及奔
騰 4 處理器。英代爾 MKL 在一個單獨的、經濟的套裝軟體中即可支持所有的這些
處理器。
無需支付版稅,即可獲得再發行權利
您可隨軟體無限量再發行運行時庫。
用戶論壇
英代爾工程師一般在英代爾 MKL 技術論壇上與其他用戶分享經驗。
英代爾 首要支持
購買英代爾 MKL 可獲一年世界一流的技術支援。在這段時間內,您能夠免費下載產
品的升級包,包括發行的主要版本。有關詳細資訊,請訪問英代爾註冊中心。
功能:
線性代數 -BLAS 和 LAPACK
在英代爾處理器中部署經過高度優化的 BLAS 和 LAPACK 常式,它們提供的性能改
善非常顯著,遠遠超出其他替代性實現。
線性代數 -ScaLAPACK
僅用於集群版。ScaLAPACK 的英代爾 MKL 實現提供的性能改善非常顯著,遠遠超出
標準 NETLIB 實現。
線性代數 -稀疏矩陣解算器
利用 PARDISO 直接稀疏矩陣解算器 該解算器是經巴塞爾大學許可的、易於使用、線
程安全、高性能且高效利用記憶體的軟體庫可在共用記憶體的多處理器上解算大型、
稀疏、對稱以及不對稱線性方程組。英代爾 MKL 還包括一個帶有靈活的反向通信介
面的共軛梯度迭代解算器(Conjugate Gradient iterative solver)。
快速傅立葉變換(FFT)
採用多維 FFT 常式(1 維到最多 7 維,支援混合基數),並提供一個易於使用的先
進的 C/Fortran 介面。英代爾 MKL 還提供一系列 C 語言常式( wrapper ),這些
常式類比 FFTW 2.x 和 3.0 介面,從而使目前使用 FFTW 的用戶能夠輕鬆地同使用
英代爾 MKL 的性能進行比較。
快速傅立葉轉換用於分散式記憶體多處理器(集群)
僅用於集群版。通過將工作分配給大量的處理器,可進一步提升您的 FFT 性能。
向量數學庫
可提高帶有計算密集型核心數學函數(冪函數、三角函數、指數函數、雙曲函數、對
數函數等)的向量實現的應用的速度。
向量亂數生成器
利用我們的向量亂數生成器加速類比,與標量亂數生成器相比,它能夠顯著提升系統
性能。
LINPACK 基準程式
英代爾通過免費提供 LINPACK 基準套裝程式來幫助您在基於英代爾 架構的系統上獲
得最佳的評測結果。
返回頁首
此版本中的新增功能
此版本的英代爾 數學核心函數庫(英代爾 MKL)側重於面向英代爾至強 5100(開發
代碼為 Woodcrest)系列平臺提供優化性能,並確保多線程性能的實現。該函數庫還
實現了很多其他的性能提升及新功能。
英代爾 至強 5100(開發代碼為 Woodcrest)的更多性能優化
其他優化進一步提高了至強 5100 系列上英代爾 MKL 8.1 版的性能。
增強的快速傅立葉變換(FFT)性能
英代爾 MKL 9.0 的優化將 FFT 性能提高到前所未有的水準。
瞭解詳細資訊
對 FFTW 介面的其他支援
利用該介面,能夠輕鬆將快速傅立葉變換從 FFTW 移植至英代爾 MKL,而不需對源代
碼進行任何更改。在此版本中,我們還提供了其他示例。
稀疏矩陣 BLAS 中的其他線程支持
以下稀疏矩陣 BLAS 三角形矩陣解算器是採用 OpenMP 進行線程處理的
‧ mkl_dcsrmm - 壓縮稀疏矩陣行格式的 3 級三角形矩陣解算器
‧ mkl_dcscmm - 壓縮稀疏矩陣列格式的 3 級三角形矩陣解算器
‧ mkl_dcoomm - 座標格式的 3 級三角形矩陣解算器
新迭代解算器
實現了新的 RCI Flexible Generalized Minimal RESidual (FGMRES) 迭代解算器
新 VSL 功能
‧ 該庫提供了快速/精確的分佈生成模式。
‧ 該庫支援根據用戶定義的擬亂數生成器的參數來生成擬隨機序列。
新 VML 功能和線程支援
‧ VML 目前支持將單精確度複數和雙精度複數用於以下函數:Acos、Acosh、
Asin、Asinh、Atan、Atanh、Cos、Cosh、Exp、Ln、Log10、Pow、Powx、Sin、Sinh
、Sqrt、Tan、Tanh。
‧ 新的單精確度和雙精度最接近整數的函數:Trunc、Ceil、Floor、Round、
NearbyInt、Rint。
‧ 還增加了另外三個單精確度和雙精度參數的函數:ErfInv、Hypot 和 Modf。
‧ VML 函數目前已採用 OpenMP* 進行線程處理。
卷積/相關性
單雙精度的多維案例都支援 FFT 模式。PDE 支持
‧ 在快速 Helmholtz、Poisson 和 Laplace 解算器中新添加了一節
‧ 添加了動態可鏈結三角函數轉換庫檔
9.0版的性能提升
英代爾 安騰 2 處理器
FFT
‧ 單雙精度,1 維實數 FFT 在 n = 2、4、8、16、32、64 和 128 時速度最
多提高了 3 倍
VML
‧ Ln、Log10、Asin、Acos、Sinh、Cosh 函數的性能提高了 25-83%
‧ 長向量(雙精度 n 250,000 或單精確度 n 500,000)的性能平均值提高了
60% 以上。這使每個元素的性能限定在小向量性能的 20% 以內。
VSL
‧ 高斯和多元高斯分佈生成器的性能分別提高了 35% 和 15%。
英代爾 酷睿 2 雙核處理器
BLAS
‧ ZDOTU、ZDOTC - 緩存資料的性能提高了 10-35%
VSL
‧ 性能提高了大約 13%
VML
‧ VML 中 Div 和 Inv 函數的性能提高了 2.7 倍
‧ Asin 和 Acos 函數的性能提高了 5 - 20%
英代爾 奔騰 4 與英代爾 至強 處理器
BLAS
‧ CGEMV - 並行資料的性能提高了 30-80%
‧ ZGEMV - 英代爾 64 位元架構系統上的未並行資料的性能提高了 5-35%
‧ DTRMV - 小尺寸的性能提高了 20%
‧ SNRM2、SCNRM2 - 緩存資料的性能最多提高了 10 倍
‧ ZDOTU、ZDOTC - 緩存的並行資料的性能提高了 10-25%,未並行資料的加
速比提高了 2 倍
其他提升
SPARSE BLAS
‧ 壓縮稀疏矩陣行格式的稀疏矩陣向量乘法常式的性能提高了 20-50%。以下
函數受到影響:mkl_dcsrgemv、mkl_dcsrsymv 和 mkl_dcsrmv。
‧ Asin 和 Acos 函數的性能提高了 5 - 20%
FFT
‧ 2 的冪的大小大於 17 的單雙精度 1 維複數 FFT 的性能最多提高了 40%
‧ 在 64 位元模式下運行的英代爾 64 位元架構系統上,1 維實數的 FFT 在
n = 2、4、8、16、32 或 64 時最多提高了 3 倍
VML
‧ 通過 OpenMP* 的自動線程處理,函數可利用多處理器系統(向量長度為
n 200),以及支援英代爾超線程技術的系統(向量長度為 n 10000)。在雙核處
理器和雙處理器系統上,系統性能最多提高了 90%