智能建筑实现了供暖、通风和空调(HVAC)、照明、电力和安全等系统的自动化。自动化需要感知数据,如室内外温度和湿度、二氧化碳浓度和居住状态。智能建筑利用数据结合各种技术,可以使其更加节能。由于暖通空调系统占建筑物能源使用量的近一半,因此智能建筑使用智能恒温器来自动控制暖通空调,并自动学习建筑物住户的温度偏好。
来自麻省理工学院信息与决策系统实验室(LIDS)的研究人员与Skoltech科学家合作,设计了一种新型智能恒温器,它使用数据高效算法,可以在一周内学习最佳温度阈值。研究成果发表在《Applied Energy》杂志上。
为了加快学习过程,研究人员使用了一种名为流形学习(manifold learning)的方法,其中复杂和 "高维 "的函数被称为 "流形 "的较简单和较低维的函数所代表。通过利用流形学习和建筑热力学知识,研究人员用一组 "阈值 "策略取代了一种通用的控制方法,这种控制方法可以有很多参数,每个策略都有更少、更可解释的参数。为学习最佳流形而开发的算法需要更少的数据,因此它们的数据效率更高。
为恒温器开发的算法采用了一种叫做强化学习(RL)的方法,这是一种数据驱动的顺序决策和控制方法,近年来在双陆棋和围棋等游戏方面备受关注。
智能恒温器的新RL算法是 "事件触发 "的,这意味着它们只有在某些事件发生时才会做出决定,而不是按照预先确定的时间表。这些 "事件 "是由某些条件达到阈值来定义的,例如房间里的温度跌出最佳范围。这使得学习更新的频率降低,降低了算法计算成本。
研究人员认为他们的方法和算法还适用于其他各种基于物理学的控制问题,如机器人、自动驾驶车辆和交通等领域,在这些领域,数据和计算效率至关重要。
论文标题为《Data-driven control of micro-climate in buildings: An event-triggered reinforcement learning approach》。